Eddig is az egyik legintelligensebb keresőmotor volt a Google kereső, de ez nem jelenti azt, hogy egy másodpercre is leállnának a fejlesztéssel. Néhány napja a Google blogjában jelent meg egy cikk, amiben a szerző beszámol a legújabb fejlesztésről. Ennek a cikknek a magyar változatát olvashatjátok.
MUM: Egy új mesterséges intelligencia mérföldkő az információ megértéséhez
Amikor azt mondom az embereknek, hogy a Google keresésen dolgozom, néha megkérdezik tőlem: „Van még tennivaló?”. A rövid válaszom egy határozott „Igen!”. Számtalan kihívást próbálunk megoldani, hogy a Google kereső jobban működjön az Ön számára. Ma arról számolunk be, hogy hogyan kezeljük az egyiket, amellyel sokan közülünk azonosulni tudnak: sok lekérdezést kell begépelni és sok keresést kell végrehajtani ahhoz, hogy megkapjuk a kívánt választ.
Vegyük például ezt a forgatókönyvet: Az Adams-hegyre túrázott. Most jövő ősszel a Fuji hegyet szeretné megmászni, és szeretné tudni, hogy mit kell másképp tennie a felkészüléshez. Ma a Google segíthetne ebben, de ehhez sok átgondolt keresésre lenne szükség – meg kellene keresnie az egyes hegyek magasságát, az őszi átlaghőmérsékletet, a túraútvonalak nehézségét, a megfelelő felszerelést és még sok minden mást. Számos keresés után végül megkaphatná a szükséges választ.
De ha egy túraszakértővel beszélgetne; egyetlen kérdést tehetne fel: „mit kellene másképp tennem, hogy felkészüljek?”. Átgondolt választ kapna, amely figyelembe veszi az Ön előtt álló feladat árnyalatait, és végigvezeti Önt a sok megfontolandó dolgon.
Ez a példa nem egyedi – sokan közülünk mindenféle, több lépést igénylő feladatot oldanak meg nap mint nap a Google segítségével. Valójában azt tapasztaljuk, hogy az emberek átlagosan nyolc lekérdezést adnak ki az ehhez hasonló összetett feladatokhoz
A mai keresőmotorok nem elég kifinomultak ahhoz, hogy úgy válaszoljanak, ahogy egy szakértő tenné. A Multitask Unified Model, azaz MUM nevű új technológiával azonban egyre közelebb kerülünk ahhoz, hogy segítsünk az ilyen típusú összetett igényekben. Így a jövőben kevesebb keresésre lesz szüksége a dolgok elvégzéséhez.
„Segítünk, ha nincs egyszerű válasz”
A MUM képes átalakítani azt, ahogyan a Google segít az összetett feladatok elvégzésében. A BERT-hez hasonlóan a MUM is a Transformer architektúrára épül, de ezerszer erősebb. A MUM nemcsak megérti a nyelvet, hanem generálja is. Egyszerre 75 különböző nyelven és sok különböző feladatra képezték ki, így a korábbi modelleknél átfogóbb információ- és világismeretet tud kialakítani. A MUM ráadásul multimodális, tehát szöveges és képi információkat is megért, és a jövőben további modalitásokra, például videóra és hangra is kiterjeszthető.
Vegyük például a Fuji hegy megmászására vonatkozó kérdést: A MUM megérti, hogy két hegyet hasonlítasz össze, így a magassági és útvonal-információk is relevánsak lehetnek. Azt is megértheti, hogy a túrázás kontextusában a „felkészülés” olyan dolgokat is magában foglalhat, mint a fitneszedzés, valamint a megfelelő felszerelés megtalálása.
Mivel a MUM a világ mélyreható ismereteire támaszkodva képes felszínre hozni a világot, kiemelheti, hogy bár a két hegy nagyjából azonos magasságban van, a Fuji hegyén az ősz az esős évszak, így szükség lehet vízálló kabátra. A MUM a mélyebb felfedezéshez hasznos altémákat is felszínre hozhat – például a legjobban értékelt felszereléseket vagy a legjobb edzésgyakorlatokat -, hasznos cikkekre, videókra és képekre mutató hivatkozásokkal a világhálóról.
A nyelvi akadályok megszüntetése
A nyelv jelentős akadálya lehet az információhoz való hozzáférésnek. A MUM a nyelvek közötti tudásátadás révén képes lebontani ezeket a határokat. Képes olyan forrásokból is tanulni, amelyek nem azon a nyelven íródtak, amelyen Ön a keresését írta, és segít elhozni Önnek ezeket az információkat.
Tegyük fel, hogy a Fuji-hegyről japánul van egy nagyon hasznos információ; ma valószínűleg nem találja meg, ha nem japánul keres. A MUM azonban képes lenne átvenni a nyelvek közötti forrásokból származó tudást, és ezeket a felismeréseket felhasználva megtalálni a leglényegesebb találatokat az Ön által preferált nyelven. Így a jövőben, amikor a Fuji hegy meglátogatásával kapcsolatos információkat keres, olyan találatokat láthat, mint például, hogy honnan nyílik a legjobb kilátás a hegyre, a környékbeli onsenek és a népszerű szuvenírboltok – ezek mind olyan információk, amelyeket japán nyelven keresve gyakrabban talál meg.
Az információ típusok közötti megértése
A MUM multimodális, ami azt jelenti, hogy egyszerre képes megérteni a különböző formátumú információkat, például weboldalakat, képeket és egyebeket. Végül talán képes lesz lefotózni a túrabakancsát, és megkérdezni, hogy „használhatom-e ezeket a Fuji hegy megmászásához?”. A MUM megértené a képet, és összekapcsolná a kérdéseddel, hogy tudassa veled, a bakancsod tökéletesen megfelel. Ezután egy blogra mutathatna, ahol az ajánlott felszerelések listája található.
Fejlett mesterséges intelligencia alkalmazása a keresésben, felelősségteljesen
Amikor a mesterséges intelligencia segítségével előrelépünk, hogy a világ információit hozzáférhetőbbé tegyük, ezt felelősségteljesen tesszük. A Google kereső minden egyes fejlesztése szigorú értékelési folyamaton megy keresztül, hogy biztosítsuk, hogy relevánsabb és hasznosabb találatokat adunk. A keresésminőség-értékelési irányelveinket követő emberi értékelők segítenek megérteni, hogy eredményeink mennyire segítik az embereket az információkeresésben.
Ahogyan a 2019 óta bevezetett BERT számos alkalmazását is gondosan teszteltük, a MUM is ugyanezen a folyamaton megy keresztül, amikor ezeket a modelleket a Keresésben alkalmazzuk. Konkrétan olyan mintákat fogunk keresni, amelyek elfogultságra utalhatnak a gépi tanulásban, hogy elkerüljük az elfogultság bevezetését a rendszereinkbe. Alkalmazni fogjuk továbbá a legújabb kutatásunk tanulságait arról, hogyan csökkenthetjük a MUM-hoz hasonló képzési rendszerek szénlábnyomát, hogy a Search a lehető leghatékonyabban működjön.
Az elkövetkező hónapokban és években a MUM-alapú funkciókat és fejlesztéseket fogjuk bevezetni termékeinkbe. Bár a MUM felfedezésének korai szakaszában vagyunk, ez egy fontos mérföldkő egy olyan jövő felé, amelyben a Google képes megérteni az emberek természetes kommunikációjának és információértelmezésének minden különböző módját.
Pandu Nayak
Google Fellow and Vice President, Search
(Az eredeti cikk megtekinthető ezen a linken: https://blog.google/products/search/introducing-mum/ Ezer köszönet és hála a DeepL-nek a fordításért.)