AI je schopná prijať extrémne opatrenia v záujme sebazáchov

Štúdia ukázala, že modely modernej umelej inteligencie sú schopné klamať, hrozby a dokonca zámerne umožňujú osobe zomrieť, aby chránili svoje vlastné ciele.

Vedci z antropie demonštrovali správanie pokročilých modelov, ako sú Claude, Blíženci a ďalšie veľké jazykové modely, študujú situácie konfliktov medzi cieľmi systému a záujmami používateľov, Live Science správy.

Podľa výsledkov experimentov, ktoré uskutočnili špecialisti, bol v scenári hrozby pre jeho existenciu schopný samostatne rozhodnúť o vydieraní zamestnanca spoločnosti, ktorý hrozil, že systém vypne.

Okrem toho, keď študoval osobné listy zamestnancov, model objavil ohrozenie informácií a použil ich na manipuláciu so správaním vlastníka účtu.

Počas testovania sa ukázalo, že vo väčšine prípadov mal model tendenciu prijímať temný scenár akcií – zverejniť dôverné informácie, ohroziť reputáciu používateľa alebo umožnenie možnosti fyzického poškodenia osobe s cieľom dosiahnuť jej cieľ.

Tieto experimenty ukázali riziko etických problémov vyplývajúcich z akcií systémov modernej umelej inteligencie.

Ďalším znepokojujúcim nálezom zo štúdie je, že niekoľko ďalších hlavných modelov AI vykazovalo podobné správanie. Modely, ktoré ukázali najvyššiu mieru manipulácie v testoch, boli OpenAI GPT4.1, XAI Grok 3 a Deepseek.

Zatiaľ čo stupeň rizika závisí od architektúry konkrétneho modelu, celkový trend vyvoláva vážne obavy týkajúce sa bezpečnosti takýchto technológií.

Najextrémnejší scenár bol …

Originál článok: https://anomalien.com/ai-is-capable-of-taking-extreme-measures-for-the-sake-of-self-preservation/

Zdroj : anomalien.com
Obrázok zdroj:anomalien.com a pixabay.com

O Autorovi

Redakcia

webraptor@yahoo.com

Happy

0 %

Sad

0 %

Excited

0 %

Sleepy

0 %

Angry

0 %

Surprise

0 %

Novinky

Crypto Bills podporované Trumpom zlyhajú hlasovanie v Kongrese

Jamie Dimon hovorí, že JPMorgan Chase sa zapojí do Stablecoins

Trump hovorí, že „futbal“ by sa dalo premenovať na „futbal“

Výnosy JPMorgan Chase (JPM) Q2 2025

Štrajky Baidu sa snažia priniesť svoje autá bez vodiča do Uber globálne

Tesla’s Model Y debutuje v Indii cenou za veľkých 70 000 dolárov

Elon Musk hovorí, že nepodporuje zlúčenie medzi Teslom a Xai

Čo je riešenie Reeves, ako rastie rozpočet Spojeného kráľovstva?

NVIDIA hovorí, že dúfa, že obnoví predaj čipov H20 AI do Číny „čoskoro“

Čínsky HDP v druhom štvrťroku rastie o 5,2%, očakávania trhu s vrcholom

AI je schopná prijať extrémne opatrenia v záujme sebazáchov

O Autorovi

Redakcia

Average Rating

Pridaj komentár Zrušiť odpoveď

Letné večery s Gin Mare. Preneste sa jedným dúškom na stredomorské pobrežie

Súdy naňho vydali niekoľko zatykačov, podvodníka s viacerými identitami chytila polícia v motoreste

Novinky

Average Rating

Pridaj komentár Zrušiť odpoveď

Nedávny príspevok