2024.05.15. 06:00
Az új GPT-4o úgy beszélget velünk, mint Scarlett Johansson
Az OpenAI elkészítette a Her ihlette mesterséges intelligenciát, amely lát, olvas, követi az arckifejezéseinket és valós időben beszélget.
Scarlett Johansson a „Her” premierjén a 8. Római Filmfesztiválon
Forrás: Getty
Fotó: Elisabetta A. Villa
Spike Jones Her / A nő című, nagy sikerű filmjében a magányos férfi szerelmes lesz új, mesterséges intelligencia által működtetett operációs rendszerébe, aki/ami Scarlett Johansson hangján társalog vele.
Most az OpenAI kiadja megszólalásig erre hasonlító, a többi hangasszisztensnél mérföldekkel jobbnak ígérkező termékét, aki lát minket, valós időben társalog, humora van, érzelmes – és remélhetőleg nem hagy ott a végén bennünket, mint a férfit a filmben.
A GPT-4o-ban az „o” jelentése omni, azaz teljes, kivétel nélküli. Úgy tűnik, joggal, mert hatalmas lépést tesz a jelenleginél sokkal természetesebb ember-számítógép interakció felé – bemenetként elfogadja szöveg, hang és kép bármilyen kombinációját, és bármilyen szöveg-, hang- és képkimenetet képes generálni.
Akár 232 ezredmásodperc alatt képes reagálni az audio bemenetekre, átlaga 320 ezredmásodperc, ami nagyjából az emberi válaszidő egy átlagos beszélgetésben. Hozza a GPT-4 Turbo teljesítményét angolul, jelentős javulást produkál a nem angol nyelvű szövegekben, ugyanakkor sokkal gyorsabb.
Tehát képes lesz Her-szerű hangasszisztensként működni, valós időben reagálni, és megfigyelni a körülötte lévő világot.
Az alábbi videón látható élő közvetítésen Mira Murati műszaki igazgató és az OpenAI mérnökei egy mobil köré ültek, hogy bemutassák az újdonságot. Légzőgyakorlatokra bírták GPT-4o-ot, később biztatták, hogy legyen egyre kifejezőbb az esti mese előadásában, majd megkérték, váltson robothangra, s végül énekhanggal kellett befejeznie a történetet.
Utána megkérdezték, mit lát a telefon kameráján, és reagáljon rá. Az asszisztenst félbe lehetett szakítani beszéd közben, láthatóan jól ért a matematikához és élőben fordít idegen nyelveken – ezúttal olaszról angolra.
Az asszisztens hangja feltűnően hasonlít Scarlett Johansson karakterére a Her című filmben. Az OpenAI vezérigazgatója, Sam Altman rejtélyesen csak egy szót írt erről az X-en: „ő”.
A ChatGPT-hez képest jelentős fejlődést mutató mesterséges intelligencia új képességei korlátozott, „alfa” kiadásban fognak megjelenni „a következő hetekben”, és először a ChatGPT Plus előfizetői számára lesznek elérhetők.
Nyilván nem véletlen, hogy az OpenAI a bevezetést éppen a Google I/O, a technológiai óriás konferenciája elé időzítette, ahol várhatóan a Gemini csapatának különböző mesterségesintelligencia-termékeit mutatják be.
A Bloomberg kiszivárogtatása szerint az OpenAI hamarosan megállapodik az Apple-lel a ChatGPT iPhone-on való működéséről. (A tájékoztatón egy kérdésre Murati azt válaszolta, hogy nem beszéltek partnerségről.) Az iPhone hangasszisztense, Siri meglehetősen megbízhatatlan, s a harapott almás óriás eddig lemaradni látszott az MI-versenyben.
Digitália
- Akkor most utáljuk a karácsonyi videót?
- „Kérlek, halj meg!” – mi is megkérdeztük, miért adott ilyen tanácsot a chatbot egy egyetemistának
- Hogyan műt ez a robot csupán videókból tanulva úgy, mint az emberi orvosok?
- Ki hinné? Az első tömeges virtuális találkozót 1916-ban tartották
- Black Friday: még egy esetleges csalódás sem veszi el a magyarok vásárlási kedvét