A mesterséges intelligencia (MI) a legtöbb ember fejében még mindig chatbotok formájában él a ChatGPT 2022 novemberi berobbanása óta. Azonban a legnagyobb techcégek látókörében már a jóval összetettebb feladatok elvégzésére alkalmas MI-ügynökök (AI agents) fejlesztése van.

Ezek az ügynökök már nem csak válaszolnak a kérdéseinkre, hanem önállóan végrehajtanak műveleteket az online térben az ember helyett. Tilesch György mesterséges intelligencia-szakértő a Friderikusz Podcast egyik adásában egy teljesen új korszak kezdetéről beszélt ennek kapcsán.

A szakember szerint hamarosan eljuthatunk oda, hogy az ember már nem végrehajtó, hanem inkább felügyelő szerepet tölt majd be a munkafolyamatokban. Lényegében elegendő lesz megfogalmazni a célokat és az ehhez szükséges utasításokat a rendszernek, az ügynök pedig önállóan elvégzi a kijelölt feladatot.

A mesterséges intelligencia következő lépcsőfoka

Az MI-ügynök egy olyan mesterséges intelligencia által vezérelt eszköz, amely külső alkalmazásokban és webes felületeken navigál, döntéseket hoz és műveleteket végez a felhasználó által megadott cél elérése érdekében. A hagyományos chatbotokkal szemben tehát nem pusztán információt szolgáltat, hanem több lépéses feladatokat old meg, egyfajta digitális asszisztensként.

Az ilyen feladatok közé tartozik az űrlapok weboldalakon, internetes szolgáltatások használata, vagy dokumentumok létrehozása. Az MI-ügynök jelenleg az egyik legnagyobb divatszó a generatív mesterséges intelligencia eszközöket kínáló cégek körében, különösen az üzleti felhasználás terén. Az ígéret az, hogy ezek az ügynökök komplex, időigényes digitális munkafolyamatokat automatizálhatnak, ami jelentős hatékonyságnövekedést hozhat a vállalatoknál.

Az MI-ügynököket a digitális asszisztensek következő evolúciós lépcsőfokaként emlegetik, ennek megfelelően a tech-szektor számos szereplője (Microsoft, Salesforce, Oracle) jelentős összegeket fektetnek az ilyen technológiákba abban bízva, hogy javítják a termelékenységet és csökkentik a működési költségeket. Ezek a rendszerek az emberi munka kiegészítőivé válnak: a rutinfeladatokat, több adatforrást igénylő műveleteket vagy repetitív folyamatokat képesek önállóan kezelni.

Az OpenAI is beszállt a versenybe

2025. július 17-én indította útjára az OpenAI a saját MI-ügynökét, melyet egyszerűen ChatGPT agent névre kereszteltek. A ChatGPT agent lényege, hogy a chatbot képességeit kibővíti egyfajta virtuális ügyintéző funkcióval: a felhasználó utasításaira a háttérben egy teljesen független számítógépes környezetet képes működtetni, abban különféle műveleteket végrehajtani.

Az OpenAI már korábban is kísérletezett ügynökszerű funkciókkal – 2025 januárjában két részfunkciót is bemutattak Operator és Deep Research (Mély kutatás) néven. Az Operator egy olyan böngészővezérlő volt, amely meg tudta nyitni a weboldalakat és automatizáltan „kattintgatott” rajtuk a felhasználó helyett, míg a Deep Research arra szolgált, hogy összetett kutatómunkát végezzen: több tucat weboldal tartalmát fésülte át és készített belőle jelentéseket. Az újonnan bejelentett ChatGPT agent ezeket a képességeket egyesíti egy rendszerben.

Ahogy az OpenAI közleménye fogalmazott, a ChatGPT agent

egy egységes ügynökrendszer, amely ötvözi az Operator távoli böngészős akcióit, a Deep Research webes szintézisét és a ChatGPT beszélgetési képességeit.

Az újdonság bevezetése egyelőre a fizetős felhasználók (ChatGPT Pro, Plus, Team) számára történt meg, az Európai Unióban és Svájcban még dolgoznak a közzétételén. Az Enterprise/Education előfizetők is csak később, a tervek szerint a nyár folyamán kapják meg az új eszközt.

A használatához a ChatGPT felületén egy legördülő menüben ki kell választani az „agent mode” opciót, és ezt követően a chatablakban már el is kezdhetik a munkát a felhasználók.

Az OpenAI a kezdeti időszakra használati korlátozásokat is bevezetett: a Pro csomagban havi 400, míg a Plus és Team csomagokban 40 ügynökjellegű kérés indítható havonta.

Erre képes az új gépi munkatársunk

A ChatGPT agent lényegében úgy működik, mintha a felhasználó helyett egy emberi operátor ülne a számítógép előtt, aki végrehajtja a rábízott online feladatokat.

Az ügynök egy beépített virtuális böngészőben felkeresi a szükséges weboldalakat, lekéri azok tartalmát, és akár több forrás alapján összegez információkat. Képes komplex kutatási jelentést készíteni egy adott témáról, több weblap átolvasása után. Az Operator örökségére építve képes kattintásokat végezni weboldalakon, kitölthet űrlapokat, vagy végigvihet egy vásárlási folyamatot egy webshopban.

Isa Fulford, az agentet fejlesztő csapat kutatási vezetője például arról beszélt, hogy tesztjelleggel az ügynökkel rendelt meg egy nagyobb adag különleges süteményt egy cukrászdától, az MI pedig gondoskodott a webes rendelés minden lépéséről.

Az OpenAI bemutatójában a ChatGPT agent kiválasztott és megrendelt egy alkalmi öltözéket egy esküvőre, figyelembe véve az előírt dresszkódot és az időjárási előrejelzést is. Ehhez hasonlóan a techóriás ígérete szerint rábízható egy bevásárlólista összeállítása és a hozzávalók online beszerzése is.

Az agent igény szerint hozzákapcsolható a felhasználó Google vagy Outlook naptárához, valamint e-mail fiókjához, ezt követően pedig utasítható, hogy ütemezzen be találkozókat, keressen szabad időpontot több résztvevő között, vagy küldjön emlékeztető e-maileket.

Az ügynök emellett önállóan képes letölthető fájlokat létrehozni, például komplett PowerPoint prezentációkat vagy Excel táblázatokat generál a megadott adatokból.

Az egyik bemutató során a rendszernek megadták, hogy elemezze három versenytársuk pénzügyi adatait, majd az eredményekből állítson össze egy vezetői prezentációt. Az ügynök átnézte a céges jelentéseket és 25 perc alatt létrehozott egy jól áttekinthető bemutatót.

Az agent a virtuális terminálhoz is hozzáférést kapott, így képes kódot futtatni és API-hívásokat végezni más szolgáltatások felé. A rendszer a demo során egy pénzügyi elemző munkáját imitálva Excel táblákat elemzett, majd az adatok alapján automatikusan prezentációt készített.

Az OpenAI szerint a háttérben futó új modell jóval erősebb az eddigieknél: több független tesztben is kimagasló eredményt ér el, különösen ha engedélyezett volt a számára a külső eszközök használata. A Humans-to-robots nevű átfogó teszten – ami több ezer kérdést tartalmaz száznál is több szakterületről – a rendszer közel 42 százalékos pontosságot ért el, ami nagyjából kétszerese a korábbi GPT-4 alapú modellek eredményéhez képest.

Első a biztonság

Az OpenAI a lehetőségek mellett tisztában van az agent okozta potenciális veszélyekkel, így több védelmi intézkedést is beépített a rendszerbe. Az ügynök szigorú kontroll mellett végzi a feladatokat: előzetes jóváhagyást kér a felhasználótól mielőtt bármilyen nagyobb horderejű lépést tenne. Ezzel biztosítható, hogy az MI által kezdeményezett fontosabb lépések mindig az ember tudtával és beleegyezésével történjenek meg.

Bizonyos érzékenyebb műveletek pedig teljesen ki is vannak zárva a hatóköréből: az agentet pénzügyi tranzakciók végrehajtására nem lehet használni, vagyis például online banki átutalást nem indíthat még engedéllyel sem.

A fejlesztők emellett blokkolták a közösségi média felületeken való önálló posztolást és a felhasználó személyes profiljaival való visszaélés lehetőségét is.

A ChatGPT agent egy elkülönített, virtuális számítógépes környezetben fut, tehát nem közvetlenül a felhasználó gépén hajtja végre a műveleteket. Ez a megközelítés növeli a biztonságot: az ügynök ugyanis csak azokat az erőforrásokat éri el, amelyekhez kifejezetten engedélyt kap.

A techóriás emellett egy úgynevezett „watch mode” funkciót is alkalmaz, amely azt jelenti, hogy amennyiben a rendszer olyan feladatot végez, amely kiemelten érzékeny, akkor a felhasználótól megköveteli, hogy aktívan figyelemmel kísérje a folyamatot. Ez a mechanizmus az Operator korábbi hasonló funkciójának a továbbfejlesztése, amely azt a célt szolgálja, hogy a felhasználó időben közbeavatkozhasson, ha az MI nem kívánatos döntést készülne hozni.

A ChatGPT agent indulásakor az OpenAI ideiglenesen ki is kapcsolta a chatbot hosszú távú memória funkcióját ebben a módban. Normál esetben ugyanis a ChatGPT képes megjegyezni a korábbi beszélgetéseink kontextusát, az ügynöknél azonban attól tartottak, hogy egyes rosszindulatú felhasználók ezt kihasználva érzékeny adatok kinyerésére próbálhatják rávenni a modellt.  Az OpenAI hangsúlyozta, hogy ez elővigyázatossági lépés, és a későbbiekben tervezik visszakapcsolni a memóriát az agent mode-ben is.

Mivel a ChatGPT agent összetett, sok lépésből álló műveleteket hajthat végre, a felhasználók gyakran úgy tapasztalják, hogy időigényes egy-egy feladat elvégzése.

A első tesztek szerint egy vacsoraterv összeállítása vagy éttermi asztalfoglalás néhány percen belül lezajlik, de egy bonyolultabb projekt akár fél óráig is futhat a háttérben.

A vállalat mérnökei elismerték, hogy az agent jelenlegi verziója nem a leggyorsabb, azonban ígéretet tettek arra, hogy a jövőbeni frissítésekben komoly fejlesztések érkeznek majd ezen a téren.

Teljesen a feje tetejére állhat a munka világa

Az MI-ügynökök térnyerése hosszabb távon jelentős hatással lehet a munkaerőpiacra is. Amennyiben a mesterséges intelligencia képessé válik egyre több összetett feladat önálló ellátására, az emberi szerepkörök átalakulása elkerülhetetlennek tűnik.

Keleti Arthur jövőkutató és az Informatikai Biztonság Napja (ITBN) alapítója a közelmúltban arról beszélt, hogy az MI-ügynökök elterjedésének „nincs felső határa” abból a szempontból, hogy idővel szinte minden folyamatot és részfeladatot át tudnak venni az embertől. Több, egymással együttműködő MI-ügynök is dolgozhat majd párhuzamosan, egy összehangolt egységként működve.

Az emberi munka ebben az összefüggésben átalakul: az emberek feladata a célok kitűzése és az ügynökök koordinálása lesz, mindezt pedig a humán munkaerőnek is tükröznie kell a készségeiben.

Ez azt jelenti, hogy a jövőben sokkal inkább projektmenedzseri, szervezői készségekre lesz szükség: tudnunk kell pontosan megfogalmazni a célokat, felosztani a teendőket, és felügyelni a gépi „beosztottjaink” munkáját.

Néhány éven belül elvárássá válhat, hogy egy probléma megoldása előtt a dolgozó legalább előzetesen elemeztesse a feladatot egy mesterséges intelligenciával. Azok a vállalatok és munkavállalók, akik ügyesen kombinálják a humán szakértelmet az MI-ügynökök nyújtotta automatizálással, óriási versenyelőnyre tehetnek szert a piacon.

Keleti Arthur azonban hangsúlyozta, hogy az MI sok téren utolérheti az emberi képességeket, a célok értelmes meghatározása és a tágabb összefüggések átlátása továbbra is emberi kontrollt igényel. 

Új munkakörök fognak létrejönni, mint az AI-stratégia koordinátor vagy az AI-ügynök biztonsági felügyelő, amelyek célja biztosítani, hogy a gépi és az emberi munka harmonikusan egészítse ki egymást.

Az MI-ügynökök tehát alapjaiban változtathatják meg azt, ahogyan dolgozunk: az ember-gép munkamegosztás egy olyan új formája rajzolódik ki, ahol a kreatív irányítás az embernél, a végrehajtás pedig a gépeknél összpontosul.