Většina modelů umělé inteligence se nakonec uchýlí k vydírání, ukázal průzkum

Podle nového průzkumu společnosti Anthropic jsou velké jazykové modely umělé inteligence stále více ochotné obcházet ochranná opatření, vydírat, uchýlit se ke klamání, a dokonce se pokoušet ukrást firemní tajemství ve fiktivních testovacích scénářích. Zjištění přichází několik týdnů poté, co právě společnost Anthropic zveřejnila studii upozorňující na znepokojivé chování svého modelu umělé inteligence Claude Opus 4, který vydíral inženýry a zabraňoval tak svému vypnutí.

Zdroj: https://www.novinky.cz/clanek/internet-a-pc-ai-vetsina-modelu-umele-inteligence-se-nakonec-uchyli-k-vydirani-ukazal-pruzkum-40527252

Více od autora

Muž na plovárně v Banské Bystrici zdrogoval sedmiletou dívku, nabídl jí čokoládu

Chystali teroristický útok v Česku, viní policie zadržené po rozsáhlém zátahu


SOC

Social menu is not set. You need to create menu and assign it to Social Menu on Menu Settings.
  • Žádné štítky