Рубріки: Новини

Anthropic випускає Claude Sonnet 4.5 — «найкращу в світі модель для програмування»

Дмитро Сімагін

Компанія Anthropic випустила нову LLM-модель Claude Sonnet 4.5, яку описано як найкращу в світі модель для програмування та найпотужнішу модель для створення складних агентів. Також представлено SDK Claude Agent — набір інструментів, які допомагають розробникам створювати агентів на основі Claude Code.

За результатами бенчмарку SWE-bench Verified, яке вимірює реальні здібності до програмного кодування, Claude Sonnet 4.5 є лідером з показником 82%. По бенчмарку OSWorld, який тестує моделі штучного інтелекту на реальних комп’ютерних завданнях, Sonnet 4.5 теж лідирує з 61,4%.

Anthropic стверджує, що Claude Sonnet 4.5 під час тестування автономно працювала 30 годин, написавши 11 000 рядків коду для створення чат-додатку, подібного до Slack або Teams.

Модель також демонструє покращені можливості в широкому спектрі завдань, включаючи міркування та математику.

Що стосується інших оновлень: 

  • в інструмент кодування Claude Code додано контрольні точки — одну з найбільш запитуваних функцій, які дозволяють миттєво повернутися до попереднього стану;
  • в інтерфейс терміналу додано вбудоване розширення VS Code;
  • до Claude API додана нова функцію редагування контексту та інструмент пам’яті, що дозволяє агентам працювати довше та обробляти ще більш складні завдання;
  • у додатках Claude внесено виконання коду та створення файлів (електронних таблиць, слайдів та документів);
  • розширення Claude for Chrome стало доступним для користувачів Max, які приєдналися до списку очікування минулого місяця.

Модель Claude Sonnet 4.5 вже доступна для використання через Claude API. Ціна залишається такою ж, як і у Claude Sonnet 4, і становить $3/$15 за мільйон токенів.

 

Останні статті

Microsoft заблокувала популярний спосіб офлайн-активації Windows

Microsoft відключила один із найвідоміших «напівлегальних» способів активації Windows — офлайн-метод KMS38. Він дозволяв продовжувати…

14.11.2025

Rust випередив C/C++ за обсягом коду, який додається до платформи Android

В Google підбили підсумки використання компонентів, написаних мовою Rust, у платформі Android. Фахівці компанії помітили…

14.11.2025

Кабінет міністрів вніс розробників оборонних технологій до переліку «критично важливих»

Кабінет Міністрів України оновив постанову, яка визначає порядок надання статусу критично важливих підприємств. Тепер до…

14.11.2025

У LinkedIn з’явився ШІ-пошук, який дозволяє знайти людей з конкретними навичками

LinkedIn додає штучний інтелект до однієї з найбільш використовуваних частин свого сайту: пошуку. Раніше цього…

14.11.2025

Apple вдвічі скорочує комісії для розробників міні-додатків

Компанія Apple оголосила про запуск нової партнерської програми Mini Apps Partner Program. Вона пропонує розробникам…

14.11.2025

«Ніхто цього не хоче»: в соцмережах розкритикували бажання Microsoft перетворити Windows на агентну ОС

Бажання президента Microsoft Павана Давулурі поділитися своїм захопленням щодо планів перетворити Windows в агентну операційну…

13.11.2025