Рубріки: Новини

Anthropic випускає Claude Sonnet 4.5 — «найкращу в світі модель для програмування»

Дмитро Сімагін

Компанія Anthropic випустила нову LLM-модель Claude Sonnet 4.5, яку описано як найкращу в світі модель для програмування та найпотужнішу модель для створення складних агентів. Також представлено SDK Claude Agent — набір інструментів, які допомагають розробникам створювати агентів на основі Claude Code.

За результатами бенчмарку SWE-bench Verified, яке вимірює реальні здібності до програмного кодування, Claude Sonnet 4.5 є лідером з показником 82%. По бенчмарку OSWorld, який тестує моделі штучного інтелекту на реальних комп’ютерних завданнях, Sonnet 4.5 теж лідирує з 61,4%.

Anthropic стверджує, що Claude Sonnet 4.5 під час тестування автономно працювала 30 годин, написавши 11 000 рядків коду для створення чат-додатку, подібного до Slack або Teams.

Модель також демонструє покращені можливості в широкому спектрі завдань, включаючи міркування та математику.

Що стосується інших оновлень: 

  • в інструмент кодування Claude Code додано контрольні точки — одну з найбільш запитуваних функцій, які дозволяють миттєво повернутися до попереднього стану;
  • в інтерфейс терміналу додано вбудоване розширення VS Code;
  • до Claude API додана нова функцію редагування контексту та інструмент пам’яті, що дозволяє агентам працювати довше та обробляти ще більш складні завдання;
  • у додатках Claude внесено виконання коду та створення файлів (електронних таблиць, слайдів та документів);
  • розширення Claude for Chrome стало доступним для користувачів Max, які приєдналися до списку очікування минулого місяця.

Модель Claude Sonnet 4.5 вже доступна для використання через Claude API. Ціна залишається такою ж, як і у Claude Sonnet 4, і становить $3/$15 за мільйон токенів.

 

Останні статті

Дефіцит оперативної пам’яті погіршується: «один із типів DRAM подорожчав на 75% лише за місяць»

Зростання цін на оперативну пам'ять починає нагадувати гіперінфляцію часів Веймарської республіки. За твердженням Bloomberg, один…

16.02.2026

Ілон Маск звинуватив філософа, який навчає LLM Claude, у відсутності дітей

Ілон Маск розкритикував жінку-філософа Аманду Аскелл, яка в компанії Anthropic відповідає на навчання LLM-моделей серії…

16.02.2026

Google оновлює розширення Conductor для Gemini CLI. Тепер воно автоматично аналізує якість вашого коду

Conductor, представлений Google в грудні як розширення для Gemini CLI, отримав перше оновлення. Тепер інструмент…

16.02.2026

Студенти більше не хочуть вчитись на факультетах інформатики. Але не проти вивчати штучний інтелект

Випускники американських шкіл, які будують плани на майбутнє, все частіше відмовляються від вступу на факультети…

16.02.2026

Ажіотаж навколо агента OpenClaw спровокував дефіцит комп’ютерів Mac: черги до 6 тижнів

Популярність локального агента з відкритим кодом OpenClaw (раніше відомий як Clawbot, Moltbot) спричинила справжню лихоманку…

16.02.2026

Google Docs тепер може стисло переказати ваш текст голосом

Після запуску перетворення тексту в мовлення, яке відкрили користувачам у серпні минулого року, популярний сервіс…

13.02.2026