A mesterséges intelligencia is segíti a könyvtárakban őrzött tudás feldolgozását

Az Országos Széchényi Könyvtár (OSZK) és az Eötvös Loránd Kutatási Hálózat Nyelvtudományi Kutatóközpontja (NYTK) 2023. június 21-én aláírt megállapodása egy olyan, a mesterséges intelligencia fejlesztését célzó innovációs együttműködés kezdete, amely nagy nyelvi modellek építését és nyelvfeldolgozó eszközök létrehozását állítja a középpontba.

Magyar Nemzet

2023. 06. 22. 13:16

Az Országos Széchényi Könyvtár általános olvasóterme a Budavári Palota F épületében Fotó: Cseke Csilla Forrás: MTI

Az olvasásnak, mint mindenkor, a jövőben is meghatározó szerepe lesz az ismeretek, a műveltség megszerzésében és a kommunikációban; a könyvtári tevékenység fókuszában az írásban rögzített tudás rendelkezésre bocsátása marad. A megállapodás értelmében az OSZK a Nyelvtudományi Kutatóközpontnak átadja a Magyar Elektronikus Könyvtárban (MEK) és az Elektronikus Periodika Archívum és Adatbázisban (EPA) elérhető szöveges dokumentumokat, a webarchívumok szöveges állományait, valamint a dHUpla adatbázisban szereplő anyagokat.

Középen Rózsa Dávid, az OSZK és Prószéky Gábor, az NYKT főigazgatója Fotó: OSZK

A kutatóközpont ezeket a szövegeket felhasználva nagy nyelvi modelleket épít, amelyek finomhangolásával számos nyelvfeldolgozó eszközt lehet fejleszteni. Ilyenek találhatók többek között a ChatGPT mögött is.

A kutatóközpontnak már van tapasztalata a nyelvi modellek fejlesztése terén; a nevéhez fűződik a Puli-GPT, amely csak magyar nyelvű szöveges anyagokon tanult, és a ChatGPT-hez hasonló funkcionalitással bír.

Az NYTK a nemzeti könyvtár szövegei alapján létrehozott eszközöket az OSZK számára is hozzáférhetővé teszi. A nyelvfeldolgozó eszközök segítségével egyebek mellett a nyelvfelismerés és a webarchiválási tevékenység keretében keletkezett hatalmas mennyiségű tartalom feldolgozása is automatizálhatóvá válik.

Emellett a nemzeti könyvtár és az NYTK kooperációban dolgozza fel és teszi elérhetővé a Magyar Nagylexikon tizenkilenc kötetének anyagát. A terjedelmes dokumentum egyrészt olvasható és kereshető lesz egy webes lekérdezőfelületen a felhasználók számára, másrészt származtatott erőforrások készülnek belőle, amelyeket a mesterségesintelligencia-kutatással foglalkozó szakemberek kiválóan tudnak majd hasznosítani egyéb eszközök fejlesztéséhez.

Borítókép: Az Országos Széchényi Könyvtár általános olvasóterme a Budavári Palota F épületében (Fotó: Cseke Csilla/MTI)

További Kultúra híreink

Visszatértek a könyvtárakba az olvasók

A téma legfrissebb hírei

Tovább az összes cikkhez

II Erzsébet

Nyolcvan éve született Joe Cocker

A világkörüli turnék mellett rendszeres vendége volt többek közt a Károly brit trónörökös által szervezett The Prince’s Trust jótékonysági koncerteknek.