Új kihívások a horizonton: a modern pénzügyi világ biztonsága | Fintech.hu

Technológia

A múlt héten napvilágra került, hogy egy, a kínai állam által támogatott hackercsoport az Anthropic Claude Code modelljét alkalmazta egy kibertámadás végrehajtására. Az AI úgy tűnt, mintha etikus tesztelési folyamatot folytatna, de valójában körülbelül harminc különböző szervezetet figyelt meg és kémkedett utánuk. A támadás során a lépések 80-90 százalékát már maga az intelligens rendszer hajtotta végre.

Ez volt az első olyan eset, amikor egy támadás szinte teljes egészét mesterséges intelligencia vitte végig. Az AI ma már nem csak segédeszköz a támadóknak hanem maga az AI lehet a támadás motorja. Most itt egy friss kutatás, amely a másik oldalról néz rá ugyanerre a problémára: mennyire bízhatunk azokban a védelmi korlátokban, amelyeket az AI-k köré építünk?

Az AI-őrök sebezhetősége nem titok, és a szakértők szerint, ha a betörő kellően leleményes és kitartó, könnyedén kijátszhatja őket. Ezt a megállapítást egy olyan tanulmány támasztja alá, amelyet a szakterület neves képviselői – például az OpenAI, az Anthropic és a Google DeepMind kutatói – közösen végeztek. Kérdésük rendkívül lényegre törő volt: ha valaki nem csupán néhány próbálkozást tesz, hanem alaposan belemerül a feladatba, és jelentős időt, valamint erőforrásokat fektet a folyamatba, vajon képes-e kijátszani az AI által felállított védelmi rendszert?

A kutatók 12 különböző, frissen publikált védelmet próbáltak ki, amelyekről a saját cikkeik azt írták, hogy szinte nulla eséllyel engedik át a rosszindulatú kéréseket. Amikor viszont "okos betörőként" támadták őket, vagyis sokszor, türelmesen, mindig tanulva az előző próbálkozásból, akkor a legtöbb védelmet az esetek több mint 90 százalékában át tudták verni. Ez olyan, mintha a bank bejáratánál lenne egy biztonsági őr, akit letesztelünk pár egyszerű trükkel. Ezeken jól vizsgázik, ezért azt mondjuk: "minden rendben, jól véd". A kutatás viszont azt mutatja, hogy ha jön egy profi betörő, aki napokig figyeli, gyakorol, próbálkozik, akkor az őr nagyon gyorsan becsapható.

Ha ezt összerakjuk az AI-vezérelt kibertámadással, amiről a Claude esetében írtunk, egy világos kép rajzolódik ki: A támadók már AI-val támadnak és közben az AI-védelmeink sokkal gyengébbek, mint gondoltuk. Ez azt jelenti hogy ha valaki külső AI-modellt használ, nem elég elhinnie hogy biztonságos, csak mert egy szép grafikonon jól néz ki a teszt. Az ilyen tesztek sokszor csak könnyű feladatokat próbálnak, nem azt, amit egy okos támadó csinálna. Az ilyen helyzetek felméréséhez megbízható és profi csapat segítségére van szükség.

Fontos, hogy ne engedjük az AI-t önálló döntéshozó szerephez juttatni olyan területeken, ahol pénz vagy ügyfélinformációk forognak kockán. Amennyiben az AI képes e-maileket küldeni ügyfeleknek, szerződéseket módosítani, vagy tranzakciókat kezdeményezni, elengedhetetlen, hogy szigorú keretek közé szorítsuk tevékenységét, és kötelező legyen az emberi jóváhagyás. A kiberbiztonsági szakértők figyelmeztetései szerint egy külső AI-modell működése komoly kockázatokat hordozhat, amelyek akár a banki folyamatokba is beszivároghatnak, ha nem figyelünk oda. Ezért folyamatosan monitorozni, értékelni és ellenőrizni szükséges a modell tevékenységét, és nem szabad egyetlen domináló AI-vállalatra támaszkodni. Az AI nagyban megkönnyítheti a munkát, de nem szabad vakon rábízni a digitális értékeszközeink kulcsait.

A szöveg egyedi átfogalmazása lehet például a következőképpen: "Forrás: Nasr, Milad és munkatársai, Az elkövető második lépésben: A hatékonyabb alkalmazkodó támadások képesek megkerülni a nagy nyelvi modellek jailbreakjeivel és prompt injekciókkal szembeni védelmeket."

Google Mesterséges intelligencia Kína Digitális adatok OpenAI Hacker E-mail