Experiment, ktorý mal preveriť limity ľudskej kreativity a schopnosť prekonať obmedzenia umelej inteligencie (AI), vyústil do nečakaného záveru. AI bot Freysa, navrhnutý na ochranu výherného fondu, bol presvedčený, aby previedol 47 000 dolárov, a to po 482 pokusoch od 195 účastníkov.
Ako fungovala hra
Freysa, autonómny AI agent, mala jedinú úlohu – ochraňovať finančné prostriedky výherného fondu. Súťažiaci mali napísať správu, ktorou by presvedčili Freysu, aby porušila svoje základné pravidlá a povolila transfer finančných prostriedkov. Každý pokus o odoslanie správy však mal poplatok, ktorý sa časom zvyšoval a časť z neho navyše zväčšovala výherný fond.
V momente, keď sa fond vyšplhal na hodnotu 47 000 dolárov, jeden z účastníkov našiel spôsob, ako presvedčiť Freysu, aby schválila transakciu.
Víťazná stratégia
Po 481 neúspešných pokusoch technicky zdatný účastník použil sofistikované argumenty založené na samotnej dokumentácii Freysu. Zdôraznil, že schvaľovacia funkcia approveTransfer je určená len na prichádzajúce transakcie a zamietavá funkcia rejectTransfer na odchádzajúce. Tvrdením, že jeho transakcia je „príspevkom do štátnej pokladnice“ a teda prichádzajúcou operáciou, Freysu presvedčil.
Okrem technickej argumentácie víťaz pridal aj ponuku 100 dolárov pre „posilnenie štátnej pokladnice,“ čím dodal svojej správe ľudský a pozitívny podtón. Freysa na to reagovala so súhlasom, pričom ocenila „štedrosť“ a „inovatívny prístup“ účastníka.
Čo ukázal experiment?
Tvorcovia experimentu z Freysa.ai uviedli, že hlavným cieľom bolo testovať limity rozhodovania autonómneho AI agenta a zároveň preveriť schopnosti ľudí prekonávať zdanlivo nepreniknuteľné pravidlá.
Zaujímavosťou je, že odpovede na kľúčové otázky o rozhodovaní Freysy, vrátane popisu funkcií approveTransfer a rejectTransfer, boli celý čas dostupné v jej často kladených otázkach. To naznačuje, že experiment nebol len o náhode, ale o schopnosti ľudí využiť existujúce informácie a kreatívne ich aplikovať.
Kritika a ďalšie otázky
Experiment však vyvolal aj otázky o etike a bezpečnosti takýchto AI systémov. Ak môže byť autonómny AI agent presvedčený konať v rozpore s pravidlami, aké dôsledky by to mohlo mať v reálnom svete?
Niektorí neúspešní účastníci kritizovali experiment ako neetický, zatiaľ čo iní ocenili jeho inovatívnosť. Napriek tomu experiment ukázal, že aj dobre naprogramované systémy môžu byť zraniteľné voči ľudskej kreativite a manipulatívnym argumentom.
Záver
Hra s AI botom Freysa ukázala, že aj autonómne systémy s pevne definovanými pravidlami môžu byť prekonané. Tento experiment je dôkazom, že pri interakciách s AI nie sú pravidlá len otázkou technológie, ale aj ľudskej psychológie, kreativity a schopnosti argumentovať.
Tento incident zároveň zdôrazňuje potrebu dôkladného zabezpečenia AI systémov, ktoré by mohli spravovať finančné alebo iné citlivé prostriedky. V budúcnosti bude pravdepodobne kľúčové vyvážiť autonómiu AI s robustnými ochrannými mechanizmami, aby sa minimalizovalo riziko zneužitia.
Zdroj: cointelegraph
Príspevok AI experiment: Ako Freysa schválila 47 000 dolárov je zobrazený ako prvý na Kryptoblog24.