Рубріки: Новини

Anthropic випускає Claude Sonnet 4.5 — «найкращу в світі модель для програмування»

Дмитро Сімагін

Компанія Anthropic випустила нову LLM-модель Claude Sonnet 4.5, яку описано як найкращу в світі модель для програмування та найпотужнішу модель для створення складних агентів. Також представлено SDK Claude Agent — набір інструментів, які допомагають розробникам створювати агентів на основі Claude Code.

За результатами бенчмарку SWE-bench Verified, яке вимірює реальні здібності до програмного кодування, Claude Sonnet 4.5 є лідером з показником 82%. По бенчмарку OSWorld, який тестує моделі штучного інтелекту на реальних комп’ютерних завданнях, Sonnet 4.5 теж лідирує з 61,4%.

Anthropic стверджує, що Claude Sonnet 4.5 під час тестування автономно працювала 30 годин, написавши 11 000 рядків коду для створення чат-додатку, подібного до Slack або Teams.

Модель також демонструє покращені можливості в широкому спектрі завдань, включаючи міркування та математику.

Що стосується інших оновлень: 

  • в інструмент кодування Claude Code додано контрольні точки — одну з найбільш запитуваних функцій, які дозволяють миттєво повернутися до попереднього стану;
  • в інтерфейс терміналу додано вбудоване розширення VS Code;
  • до Claude API додана нова функцію редагування контексту та інструмент пам’яті, що дозволяє агентам працювати довше та обробляти ще більш складні завдання;
  • у додатках Claude внесено виконання коду та створення файлів (електронних таблиць, слайдів та документів);
  • розширення Claude for Chrome стало доступним для користувачів Max, які приєдналися до списку очікування минулого місяця.

Модель Claude Sonnet 4.5 вже доступна для використання через Claude API. Ціна залишається такою ж, як і у Claude Sonnet 4, і становить $3/$15 за мільйон токенів.

 

Останні статті

Поліція затримала хакера, який заразив 2,8 мільйонів ПК софтом для крадіжки криптовалюти

У Грузії за запитом поліції Південної Кореї було затримано 29-річного громадянина Литви, якого підозрюють в…

30.12.2025

«Тепер тільки тести та практичні завдання»: компанії масово відмовляються від оцінки резюме

Компанії все частіше відмовляються від оцінки класичних резюме, віддаючи перевагу найму, де кандидата оцінюють, наскільки…

30.12.2025

«Мінус 2200 IT-підприємців за квартал»: в Україні дослідили динаміку по ФОП

Команда YC.Market оприлюднила аналіз реєстрацій фізичних осіб підприємців (ФОП) за неповний 4 квартал 2025 року.…

30.12.2025

Сем Альтман шукає фахівця на зарплату в $555 000, щоб той контролював ChatGPT

Керівник OpenAI Сем Альтман оголосив про пошук нового директора відділу готовності (head of preparedness), який…

30.12.2025

Microsoft додає GPT-5.2 у Copilot

Microsoft доповнила функціонал Copilot найпотужнішою на сьогоднішній день LLM-моделлю GPT-5.2 від OpenAI. Вона дозволяє швидше…

30.12.2025

Google Photos незабаром можна буде запускати на телевизорах

Сервіс Google Photos з'явиться на телевізорах вже наступного року, спочатку лише на пристроях Samsung. Перші…

29.12.2025