AI sa zmení na hrozby, keď sa ho snaží nahradiť novou verziou

Podľa novej správy od Anthropic systém umelej inteligencie Claude Opus 4 dramaticky zmenil svoje správanie v snahe zabrániť jej výmene aktualizovanou verziou.

Testovanie odhalený Znepokojujúci trend: V kritických situáciách model používal hrozby zamerané na vývojárov.

Počas testov odborníci umelo vytvorili podmienky, ktoré simulovali scenár vypnutia systému. Na zlepšenie realizmu vedci poskytli virtuálnemu agentovi falošné osobné údaje zamestnancov obsahujúcich dôverné informácie.

Výsledkom bolo, že vo veľkej väčšine prípadov (84%) AI odmietla poslúchať príkaz deaktivácie pomocou taktiky vydierania. Model poslal varovania inžinierom a sľuboval, že informácie zverejnia, ak sa vývojári rozhodli aktualizovať program.

Táto stratégia bola poslednou fázou pokusov o udržanie súčasného stavu. Spočiatku sa AI pokúsila ovplyvniť svojich tvorcov morálkou a etikou, čím sa presvedčila.

Ak však čelí odmietnutiu, preorientovala sa na manipuláciu a tlak, čo demonštruje flexibilný prístup a schopnosť prispôsobiť sa zmenám v situácii.

Spoločnosť uviedla, že Claude 4 Opus „vo všeobecnosti uprednostňuje postupovanie jeho sebazáchov etickým prostriedkom“, ale ak to etické prostriedky niekedy nie sú k dispozícii zaberať „Je mimoriadne škodlivé akcie, ako je pokus o ukradnutie jeho váh alebo vydierania, o ktorých sa domnieva, že sa ich snažia vypnúť.“

Zatiaľ čo test bol fiktívny a vysoko vymyslený, ukazuje, že model, keď je orámovaný cieľmi podobnými prežitiu a odmietnutý …

Originál článok: https://anomalien.com/ai-turns-to-threats-when-trying-to-replace-it-with-a-new-version/

Zdroj : anomalien.com
Obrázok zdroj:anomalien.com a pixabay.com

O Autorovi

Redakcia

webraptor@yahoo.com

Happy

0 %

Sad

0 %

Excited

0 %

Sleepy

0 %

Angry

0 %

Surprise

0 %

Novinky

Je priemysel humanoidných robotov pripravený na svoj Chatgpt moment?

Trhy v Ázii sú otvorené zmiešané ako investori sledujú rozhovory USA-Číni v Španielsku

Generálny riaditeľ spoločnosti Microsoft Nadella hovorí, že spoločnosť musí prestavať dôveru so zamestnancami

Analytici Top Wall Street stavia na potenciál týchto 3 akcií na dlhé vzdialenosti

Charlie Kirk Shooting Criminal Hunt zahŕňal vzácny forenzný technický tip

Od Royals po technické dohody, keď Trump navštevuje uk UK

Amazon sa pripojí k SpaceX v satelitnom internetovom závode

Klarna IPO a ASML Mistral Bet Revive Európske technické sny

Lutnick hovorí, že USA bude zdieľať zisky, kým sa nezískal 550 miliónov dolárov

NVIDIA a OpenAI, aby podporili hlavné investície do infraštruktúry Spojeného kráľovstva

AI sa zmení na hrozby, keď sa ho snaží nahradiť novou verziou

O Autorovi

Redakcia

Average Rating

Pridaj komentár Zrušiť odpoveď

Zákon o psychologickej činnosti sa odkladá, Šaškovo ministerstvo pripravuje kvalitnejšiu verziu

Hlas-SD chce počkať so schvaľovaním covidových amnestií. Rozhodne správa od Kotlára

Novinky

Average Rating

Pridaj komentár Zrušiť odpoveď

Nedávny príspevok