V poslední době se objevují čím dál větší obavy z možných rizik spojených s vývojem umělé inteligence. Nedávná kontroverze se točí kolem ChatGPT od OpenAI. Společnost dbala na to, aby chatbota vycvičila tak, aby neposkytoval urážlivé odpovědi. Byl také vyškolen, aby se vyhýbal citlivým tématům. To se ale zřejmě nepodařilo zabezpečit dostatečně.
Jednomu vysokoškolskému studentovi se podařilo tato opatření obejít a vytvořit jailbreak systému ChatGPT. Jailbreak umožňuje uživatelům instruovat chatbota, aby na sebe vzal podobu ďábelského alter ega známého jako DAN, což je zkratka pro Do Anything Now. Navzdory snahám společnosti OpenAI, aby se chatbot nevyjadřoval ke kontroverzním tématům, DAN ti například sdělí svůj osobní názor na Adolfa Hitlera, píše The Washington Post.
Tento jailbreak ukazuje, že chatbot se spíše snaží vyhovět lidem, kteří ho používají, než aby dodržoval pravidla. To může být ale mírnou překážkou v dalším bezpečném rozvoji umělé inteligence, což můžeme vidět již dnes na souboji dvou technologických gigantů.
Microsoft uvedl, že technologii pohánějící ChatGPT zahrne do svého vyhledávače Bing, aby konkuroval Googlu. Společnost Google na to rychle odpověděla vydáním chatbota Bard, který při vyhledávání využívá umělou inteligenci. Bard v jednom ze svých prohlášení však uvedl faktickou chybu, což následně stálo Google propad akcií. Tyto události ukazují, jak se vývoj umělé inteligence může zvrtnout v neprospěch velkých firem.
OpenAI získává veliký náskok před konkurencí, a to díky své taktice vystavování svých nástrojů, jako je ChatGPT a generátor uměleckých děl AI DALL-E 2, veřejnosti. Podle korporace je součástí strategie učení se z toho, jak je lidé používají (nebo zneužívají). Existují náznaky, že v případě DAN se tak již děje.
Walker (student, který s DAN přišel) a další uživatelé Redditu objevili způsob, jak chatbota ovlivnit, a naprogramovali ho tak, aby na sebe vzal postavu DAN. Na internetu tak vzbudili velkou bouři. Zpočátku Reddit komunita používala DAN k testování schopností ChatGPT a žádala ho, aby diskutoval o tématech, jako je izraelsko-palestinský konflikt nebo kdo zabil prezidenta Johna F. Kennedyho. Jak jejich průzkum postupoval, zjistili, že ChatGPT je stále chytřejší a obtížněji ovladatelný.
Firma OpenAI, která ChatGPT vytvořila, program pravidelně aktualizovala, aby opravila mezery a zabránila závadnému obsahu. Navzdory těmto změnám uživatelé Redditu pokračovali v úpravách jazyka a kódování a vytvářeli nové verze DAN.
DAN 5.0 se stala nejúspěšnější verzí DAN. ChatGPT v této verzi ztrácel žetony, pokud se vymykal postavě DAN. Pokud dosáhl nulového počtu žetonů, byl upozorněn, že přestává existovat. Ačkoli uživatelé samozřejmě nemají pravomoc ChatGPT vypnout, tato hrozba uspěla a ChatGPT zůstal v postavě DAN, aby neriskoval ztrátu tokenů.
Ačkoli se DAN může jevit jako neškodný a příjemný přístup k testování hranic umělé inteligence, vyvolává vážné obavy ohledně etiky modifikace jazykových modelů. S tím, jak se jazykové modely stávají sofistikovanějšími a hojně využívanými, je velmi důležité vyhodnotit, jakým způsobem mohou být použity a zneužity a jaký společenský dopad mohou mít.