Így képzeli el a mesterséges intelligencia jövőjét a 3 legnagyobb vállalat
2024. jún. 11.

Sűrű heteket tapasztalhatnak meg a nyári szünet előtt azok, akik naprakészek akarnak maradni a mesterséges intelligencia világában zajló történésekkel. Ez az elmúlt években megszokottá vált rohanás mellett annak is köszönhető, hogy az MI területét jelenleg domináló 3 legnagyobb vállalat, a Google, az OpenAI és a Microsoft is nagyszabású rendezvényeik keretein belül mutatták be legújabb fejlesztéseiket, és azt, hogy milyennek képzelik az MI jövőjét.
A bejelentési sort az OpenAI kezdte, amely bejelentette az egyelőre csak Premium felhasználók számára elérhető GPT-4o, másnéven Omni elnevezésű intelligens asszisztensét. A vállalat, és nagyjából a világ első fejlett, multimodális rendszere (amelyet fotó, szöveg és hang alapján is lehet irányítani) rendkívül diverz feladatok megoldására képes. Az Omnit éppúgy megkérhetjük arra, hogy azonosítsa a kamera képe alapján a környezetünket, mint arra, hogy vezesse rá gyermekünket egy matekfeladat megoldására.
A bemutató során a Sky elnevezésű hangprofiltól lehetett hallani a legtöbb megszólalást, amely kísértetiesen hasonlített a filmsztár Scarlett Johannson hangjára, nem meglepő, hogy ebből botrány is lett. Ez azonban semmit nem vesz el az emberi reakciókra figyelő, tökéletes hangsúlyozásra, és hihető érzelmek átadására képes fejlesztés eredményeiből. Az Omni bemutatásából jól látszik, hogy az OpenAI abban látja a jövőt, hogy az emberi kapcsolatokat mímelve tegye a hétköznapjaink megkerülhetetlen részévé a mesterséges intelligenciát.
A Google és a Microsoft ezzel szemben sokkal inkább a praktikus megoldásokat bízná rá a rendszereire. Mint azt Sundar Pichai, a Google anyacégének, az Alphabetnek a vezetője is elmondta az éves I/O rendezvényen, a Bardot felváltó Gemini fejlesztésük rövidesen szinte minden programjukba beépül, a Google keresőmotorján át az androidos mobilokon keresztül a Gmail levelezőrendszerig. A Gemini számtalan kényelmi funkciót csempész be a hétköznapjainkba: könnyed levélgenerálás, gyors keresés a fotóink között, még pontosabb Google-böngészés és az eredmények rövid összefoglalása. Bár a Google is dolgozik az OpenAI-éhoz hasonló multimodális rendszeren, ez azonban láthatóan nem a fő fókusz: a Google a feladatok leegyszerűsítésében, a meglévő felületek tökéletesítésében látja a megoldást, és nem annyira az új platformok létrehozásában.
Ez a hozzáállás természetesen érthető az elképesztő böngészőpiaci dominanciát látva. A Chrome több mint 80 százalékos piaci részesedéséből a Microsoft tulajdonolta Bing egy aprónyit ugyan el tudott szívni az elmúlt hónapokban a ChatGPT-integráció révén, ám ennek mértéke elhanyagolhat. Ezt a Microsoft is belátta, és már nem annyira a Bingre, sokkal inkább a Windows-ra fordította energiáját, melynek eredményeként a mesterséges intelligencia több milliárd ember számítógépébe is bekerülhet, a Windows operációs rendszerbe való integráción keresztül.
Ehhez persze nemcsak szoftveres, hanem hardveres frissítésekre is szükség lesz, ami némileg bekorlátozza a Microsoft MI-fejlesztéseinek térnyerését. A Microsoft Recall és Copilot fejlesztése a Google Geminijéhez hasonlóan a könnyebb információáramláshoz és az egyszerűbb feladatok automatizálásához járulhat hozzá, amellett, hogy a fájljaink megkeresését is könnyebbé teszi. Bár a három nagy esemény lezajlott, az Apple június elején esedékes éves fejlesztői rendezvényén, a WWDC-n minden bizonnyal lesznek még érdekességek, ugyanis a cupertinói cég az iOS 18-cal fog komolyabb lépést tenni a mesterséges intelligencia felé. A hírek szerint ennek lefejlesztésében pedig a Google-nek is komoly szerepe lehet, hiába gondol a két cégre vetélytársakként a világ nagy része.