V máji Anthropic oznámil dva nové systémy AI, Opus 4 a Sonnet 4. Teraz, o menej ako šesť mesiacov neskôr, spoločnosť zavádza Sonnet 4.5 a nazýva ju najlepším kódovacím modelom na svete doteraz. Základom antropie pre toto tvrdenie je výber referenčných hodnôt, v ktorých nová AI prevyšuje nielen jej predchodcu, ale aj drahšie OPUS 4.1 a konkurenčné systémy vrátane spoločnosti Google’s Blíženci 2.5 Pro a GPT-5 z OpenAi. Napríklad v Osworlde, sada, ktorá testuje modely AI na počítačových úlohách v reálnom svete, Sonnet 4.5 stanovila rekordné skóre 61,4 percenta, čím sa za OPUS 4.1 uložila 17 percentuálnych bodov.
Nový model je zároveň schopný autonómne pracovať na viacstupňových projektoch na viac ako 30 hodín, čo je významné zlepšenie zo siedmich hodín Opus 4, ktoré by sa mohlo udržať pri štarte. To je dôležitý míľnik pre typ agentických systémov, ktoré chce Anthropic stavať.
Sonnet 4.5 prekonáva staršie modely Antropic v kódovaní a agentických úlohách.
(Antropické)
Možno ešte dôležitejšie je, že spoločnosť tvrdí, že spoločnosť Sonnet 4.5 je doteraz jej najbezpečnejším systémom AI, pričom model prešiel „rozsiahlym“ bezpečnostným školením. Tento výcvik sa premieta do chatbot antropickej hovorí, že je „v podstate„ menej náchylný k „sykofancii, klamstvu, hľadaniu moci a tendenciou podporovať klamlivé myslenie“-všetky potenciálne modelové vlastnosti, ktoré majú vlastnosti, ktoré majú v posledných mesiacoch pristál v horúcej vode v horúcej vode. Anthropic zároveň posilnil ochranu Sonnet 4.5 proti okamžitým injekčným útokom. Vzhľadom na sofistikovanosť nového modelu Anthropic uvoľňuje Sonnet 4.5 v rámci bezpečnostnej úrovne AI, čo znamená, že prichádza s filtrami určenými na zabránenie potenciálne nebezpečných výstupov súvisiacich s výzvami okolo chemických, biologických a jadrových zbraní.

Graf ukazujúci, ako sa Sonnet 4.5 porovnáva s ostatnými pohraničnými modelmi pri testovaní bezpečnosti.
(Antropické)
Vďaka dnešnému oznámeniu spoločnosť Anthropic tiež zavádza zlepšenia kvality života v rámci produktov Claude. Na spustenie má Claude Code, populárny agent spoločnosti Coding, obnovené rozhranie terminálu, vrátane novej funkcie s názvom Checkpoints. Ako pravdepodobne uhádnite z mena, umožňujú vám uložiť váš pokrok a vrátiť sa späť do predchádzajúceho stavu, ak Claude píše nejaký funky kód, ktorý nefunguje celkom tak, ako ste si predstavovali. Tvorba súborov, ktoré antropické začal sa rozvíjať na začiatku mesiacateraz je k dispozícii všetkým profesionálnym používateľom, a ak ste sa pripojili k čakacej listine Claude pre prehliadač Chrome, môžete začať používať rozšírenie ešte dnes.
Ceny API pre Sonnet 4,5 zostáva na 3 dolárov za milión vstupných žetónov a 15 dolárov za rovnaké množstvo výstupných žetónov. Vydanie Sonnet 4.5 Caps z silného septembra pre antropické. Len jeden deň po Microsoft Pridané modely Claude do Copilot 365 Minulý týždeň, OpenAI prijatý Jeho súper ponúka najlepšiu AI pre pracovné úlohy.
(tagstotranslate) Anthropic (T) Claude Code (T) AI Systems
Zdroj: https://www.engadget.com/claude-sonnet-45-is-anthropics-safest-ai-model-yet-170000161.html?src=rss
Obrázok: www.engadget.com
Average Rating