Az IBM új megközelítést alkalmaz a mesterséges intelligencia fejlődésében: mostantól a felejtés képességét is tanítja az AI-nak.

Az AI fejlődése során kiemelkedő jelentőséggel bír az adatok minősége, hiszen ezek képezik az alapját a nagy nyelvi modellek tréningjének. Amennyiben a fejlesztők nem megfelelő vagy hibás adatokat használnak, az komoly következményekkel járhat. A rossz információk eltorzíthatják a modellek tudását, ami végső soron téves következtetésekhez és döntésekhez vezethet. Ez különösen aggasztó lehet a döntéshozók számára, akik a modellek által generált elemzésekre és ajánlásokra támaszkodnak. Az ilyen helyzetek elkerülése érdekében elengedhetetlen a gondos adatgyűjtés és -ellenőrzés, hogy a mesterséges intelligencia valóban megbízható és hasznos eszközként szolgálhasson.
A toxikus adatok kiiktatása mellett hogyan biztosíthatjuk, hogy a mesterséges intelligencia csak a szükséges ideig dolgozzon érzékeny információkkal, és mindezt a jogszabályi keretek figyelembevételével tegye? E kérdések inspirálták az IBM legfrissebb innovációit, amelyek lehetővé teszik, hogy a modellek nemcsak megbízhatóan működjenek, hanem a jogi előírásoknak is megfeleljenek, miközben szelektíven "elfelejtenek" bizonyos adatokat.
Ez az unlearning technológia forradalmi lépés lehet az MI hatékonyságának fokozásában, továbbá az adatbiztonság és az adatvédelem szempontjából is jelentős előnyöket kínál. Különösen releváns ez a generatív nagy nyelvi modellek (LLM) világában, amelyek jellemzően hatalmas mennyiségű online adatot használnak a tanulmányi folyamataik során.
Az unlearning fogalmát talán legjobban "fordított tanulásként" lehetne meghatározni. Ennek a megközelítésnek az a lényege, hogy a modellekből eltávolítja a nem kívánt adatokat, anélkül, hogy újra kellene kezdeni a teljes tanítási folyamatot. Ez a technológiai újítás jelentős szerepet játszhat abban, hogy a jövőbeli AI modellek ne csupán hatékonyabbak, hanem etikusabbak is legyenek. Különösen fontos lehet ez olyan helyzetekben, ahol a szenzitív adatok törlése kötelező jogi vagy etikai elvárás.
Az IBM kutatói úgy vélik, hogy az unlearning folyamata kulcsfontosságú lépést jelenthet az AI-modellek finomításában és a biztonságosabb működésük megteremtésében. Ez a megközelítés elengedhetetlen ahhoz, hogy a vállalatok és intézmények vezetői még nagyobb bizalommal forduljanak a mesterséges intelligencia alkalmazások felé.
A fordított tanulás nemcsak a téves következtetésekhez vezető bemenetek kiszűrésében nyújt támogatást, hanem hatékony megoldást is kínál a nagy nyelvi modellek válaszaiban előforduló toxikus vagy etikai szempontból problémás információk azonosítására és eltávolítására.
Például, ha az alapvető adatok faji, nemi vagy szocioökonómiai háttér alapján torzítanak, az súlyos következményekkel járhat. Ezek a torzítások könnyen bekerülhetnek a modellekbe, amelyek a döntéshozatal alapját képezik. Az így kapott eredmények és generált kimenetek hátrányosan befolyásolhatják azokat, akik álláshirdetésekre jelentkeznek, ha az önéletrajzukat egy mesterséges intelligencia rendszere válogatja ki, vagy akár a hiteligénylőket is, akiknek az elsődleges elbírálását szintén AI végzi.
Az unlearning folyamata lehetőséget teremt a torzított adatokból származó hibás tanulmányok korrekciójára. Amikor egy mesterséges intelligencia modell egy elfogult adathalmazon keresztül "elsajátít" egy káros viselkedést, az unlearning révén nem csupán elnyomja ezt a torzítást, hanem képes lesz arra is, hogy teljesen elfelejtse annak minden aspektusát.
Az unlearning folyamat egyúttal lehetőséget kínál a döntéshozók számára, hogy kezeljék a mesterséges intelligenciával kapcsolatos egyik legfontosabb és leggyakoribb aggályt: a személyes és érzékeny adatok védelmét. Nem meglepő, hogy a technológia iránti kereslet elsődlegesen az adatvédelmi jogszabályok, mint például az EU-s GDPR, bevezetése révén emelkedett meg. Ezek a jogszabályok világosan megfogalmazzák, hogy az adattulajdonosok kérésére a vállalatoknak és intézményeknek kötelezően törölniük kell a személyes adatokat.
A klasszikus adatvédelmi módszerek sokszor nem elegendőek azoknál a modelleknél, amelyek milliárdnyi szóból és terabájtnyi adathalomból táplálkoznak. Ilyen esetekben a fordított tanulás alkalmazása válik szükségessé.
Az IBM legújabb innovációi kiemelkedő hatékonysággal segítik a mesterséges intelligenciát alkalmazó cégeket és intézményeket. Ezek a fejlesztések lehetővé teszik, hogy a modellek automatikusan elfelejtsék azokat az adatokat, amelyek torzítást okozhatnak vagy személyes jellegük miatt érzékenynek számítanak. Eközben azonban megőrzik a többi, értékes információt az adathalmazon, ezáltal növelve a modellek teljesítményét és megbízhatóságát.
Ahogy a mesterséges intelligencia modellek integrálódnak az üzleti folyamatokba, kulcsfontosságúvá válik, hogy kizárólag megbízható adatokra támaszkodjanak a döntéshozatal során. Hosszú távon a tanító adatok minősége határozza meg, mely vállalatok és intézmények tudják majd a legjobban kihasználni az AI adta lehetőségeket. Az adatminőség kiemelkedő szintjének elérése nem egy egyszeri feladat, hanem egy folyamatos folyamat: az IBM holisztikus megközelítése segít a szervezeteknek abban, hogy kezdetben kisebb léptékben indítsák el adatminőségi programjaikat, majd fokozatosan kiterjesszék azokat az egész adatökoszisztémára.
„Hozd létre a saját, egyedi hangzásodat!” – hangsúlyozta Pikéthy Árpád, az IBM magyarországi vezetője.
"Olyan eszközöket fejlesztünk, amelyekkel az AI etikus, transzparens és megbízhatóbb lesz a vállalati és az intézményi döntéshozók számára is. Az unlearning tehát lehetőséget ad arra, hogy a modelljeink biztonságosabbak legyenek, úgy, hogy közben javul a hatékonyságuk is. Továbbá a modelljeink megfelelnek a jogi és adatbiztonsági előírásoknak és elvárásoknak, különösen azokban az iparágakban, ahol az érzékeny információk kezelése fontos kihívást jelent. Az IBM jelenleg saját, Granite névre hallgató modellcsaládján is teszteli az unlearning technológiát. Nekünk az a véleményünk, hogy az unlearning kitörési pontot jelenthet az AI alkalmazások iránti bizalom erősítésében."
Illés János, az IBM termékeit Magyarországon értéknövelt viszonteladóként forgalmazó Arrow ECS Hungary Kft. IBM termékekért felelős üzletágvezetője hozzátette, hogy