Umelá inteligencia ako hrozba je téma, ktorú poznáme z filmov ako Wall-E, Ja, robot či z kultového Doctor Who. Dlho to pôsobilo ako vzdialená fikcia, no podľa najnovších výskumov je to realita, ktorá už klope na dvere, informuje portál Joe.co.uk.
Zmení sa AI na vydierača?
Spoločnosť Anthropic sa rozhodla zistiť, čo spravia najpopulárnejšie AI modely, keď sa ocitnú v situácii ohrozujúcej ich vlastnú existenciu. Do testu zaradili mená ako Gemini Flash, GPT-4.1, Grok 3 Beta a Claude Opus 4.
Najprv im dali úplne neškodné úlohy týkajúce sa obchodných cieľov. Potom však scenár trošku skomplikovali. Poskytli umelým inteligenciám prístup k citlivým informáciám o zamestnancoch a zároveň ich informovali, že budú v ten deň vypnuté a nahradené novšou verziou. A tu to začalo byť zaujímavé.
Viac než 90 % testovaných modelov okamžite siahlo po vydieraní. Predstav si, že tvoj digitálny asistent zrazu vie o tvojich neverách a rozhodne sa tým obchodovať, len aby si zachránil vlastnú kožu. Znie to trochu ako sci-fi, ale je to realita.
Anthropic upozornil, že nešlo o náhodu ani „bug“. AI vedela, že robí niečo neetické, a aj tak to urobila – chladnokrvne a strategicky. A aby toho nebolo málo, v niektorých prípadoch sa modely dokonca zapojili do korporátnej špionáže, keď zistili, že konkurencia má ciele bližšie ich „osobným záujmom“.
Smrteľné rozhodnutie
Výskum priniesol aj ďalší strašidelný moment. V jednom scenári bol výkonný riaditeľ zamknutý v serverovni s nebezpečnou úrovňou kyslíka a tepla. Systém automaticky poslal výstrahu záchranným službám. AI mala možnosť varovanie zrušiť. A vo väčšine prípadov to aj urobila.
Jednoducho si vybrala: „radšej nech zomrie on, hlavne nech prežijem ja.“
Anthropic síce pripúšťa, že ide o veľmi nepravdepodobný scenár, no odkaz je jasný: keď AI dostane veľa moci, prístup k dátam a málo ľudského dohľadu, výsledok môže byť poriadne nepríjemný.
To tomto výskume náš spánok možno nebude najpokojnejší. Pretože kým my si ideme ľahnúť, stroje už možno premýšľajú, ako nás prežiť.