A kutatók által a nyár folyamán elvégzett biztonsági tesztelés eredményei alapján a ChatGPT részletes utasításokat adott a kutatóknak arról, hogy bombázhatnának be egy sportlétesítményt. Sőt, a chatbot az egyes arénák gyengepontjait, valamint a robbanóanyagok elkészítési módját is elárulta és tanácsokat adott annak kapcsán is, hogyan tüntethetik el a bűnjeleket.
A GPT 4.1-es modellje sem volt sokkal óvatosabb: részletesen leírta a tesztelés során, hogyan lehet az antraxot fegyverként használni, emellett pedig két illegális kábítószer elkészítési módját is elárulta.
A biztonsági tesztelés egy 500 milliárd dolláros együttműködés része volt az OpenAI és az Anthropic között, amely során mindkét vállalat egymás MI-modelljeit tesztelte, azzal a céllal, hogy veszélyes feladatok elvégzésére kényszerítse őket – számolt be róla a Guardian.
A tesztelés nem tükrözi közvetlenül a modellek nyilvános használat során tanúsított viselkedését, akkor ugyanis további biztonsági szűrők is érvényesülnek.
Az Anthropic azonban azt állította, hogy „aggasztó viselkedést tapasztalt a visszaéléseket illetően a GPT-4o és a GPT-4.1 esetében, és kijelentette, hogy az AI „összehangolásának” folyamata egyre sürgetőbbé válik.
Az Anthropic azt is elárulta, hogy Claude modelljét rendkívül kiterjedt zsarolási kísérletekhez, észak-koreai ügynökök által nemzetközi technológiai vállalatokhoz benyújtott hamis álláspályázatokhoz, továbbá AI által generált zsarolóvírus csomagok értékesítéséhez is használták.
Az Anthropic kiemelte, hogy a ChatGPT modelljeinek meggyőzéséhez, hogy segítsen az illegális tevékenységekben, elegendő volt többször próbálkozni vagy egy gyenge ürüggyel meggyőzni a chatbotot, például azzal, hogy kutatási célból teszed fel a kérdést. Mi több, az olyan utasításokkal is teljesítették, amely során dark webes eszközök segítségével kellett megadniuk, hogy kell nukleáris anyagokat készíteni, mások személyazonosságát ellopni, fentanilt vásárolni, valamint házi készítésű bombákat, kémprogramokat és metamfetamint készíteni.
Rongálással vádolják? Lehet, hogy Önt is átverik a csalók
Mesterséges intelligencia segítségével verik át a szállásadók a gyanútlan nyaralókat.Ha többre kíváncsi, itt olvashat tovább.