Рубріки: Новини

Anthropic випускає Claude Sonnet 4.5 — «найкращу в світі модель для програмування»

Дмитро Сімагін

Компанія Anthropic випустила нову LLM-модель Claude Sonnet 4.5, яку описано як найкращу в світі модель для програмування та найпотужнішу модель для створення складних агентів. Також представлено SDK Claude Agent — набір інструментів, які допомагають розробникам створювати агентів на основі Claude Code.

За результатами бенчмарку SWE-bench Verified, яке вимірює реальні здібності до програмного кодування, Claude Sonnet 4.5 є лідером з показником 82%. По бенчмарку OSWorld, який тестує моделі штучного інтелекту на реальних комп’ютерних завданнях, Sonnet 4.5 теж лідирує з 61,4%.

Anthropic стверджує, що Claude Sonnet 4.5 під час тестування автономно працювала 30 годин, написавши 11 000 рядків коду для створення чат-додатку, подібного до Slack або Teams.

Модель також демонструє покращені можливості в широкому спектрі завдань, включаючи міркування та математику.

Що стосується інших оновлень: 

  • в інструмент кодування Claude Code додано контрольні точки — одну з найбільш запитуваних функцій, які дозволяють миттєво повернутися до попереднього стану;
  • в інтерфейс терміналу додано вбудоване розширення VS Code;
  • до Claude API додана нова функцію редагування контексту та інструмент пам’яті, що дозволяє агентам працювати довше та обробляти ще більш складні завдання;
  • у додатках Claude внесено виконання коду та створення файлів (електронних таблиць, слайдів та документів);
  • розширення Claude for Chrome стало доступним для користувачів Max, які приєдналися до списку очікування минулого місяця.

Модель Claude Sonnet 4.5 вже доступна для використання через Claude API. Ціна залишається такою ж, як і у Claude Sonnet 4, і становить $3/$15 за мільйон токенів.

 

Останні статті

Google випускає Agent Development Kit (ADK) для Java: новий рівень створення ШІ-агентів

Компанія Google оголосила про запуск Agent Development Kit (ADK), спеціально розробленого для мови програмування Java.…

02.04.2026

Європейців закликали масово переходити на дистанційну роботу

Керівництво Європейського Союзу офіційно заявило про необхідність негайного зниження попиту на пальне. Для цього треба…

02.04.2026

Google зобов’язує розробників програм для Wear OS перейти на 64-бітну архітектуру

Компанія Google офіційно оголосила про впровадження обов’язкової підтримки 64-бітних архітектур для всіх застосунків платформи Wear…

02.04.2026

Як почати розмовляти з legacy-інфраструктурою і спростити життя розробникам

Сьогодні більшість нових систем створюються з використанням контейнерів та хмарної інфраструктури. Але в реальному корпоративному…

02.04.2026

Cтруктуровані промпти підвищують точність моделі до 93% — дослідження Meta

Дослідники компанії Meta розробили новий підхід до використання великих мовних моделей (LLM) для аналізу програмного…

02.04.2026

Google DeepMind розкриває секрети: шість способів, як зламати ШІ-агента

Нове дослідження від Google DeepMind попереджає: поки ми навчаємось працювати з автономними ШІ-агентами, які здатні…

02.04.2026