Anthropic випускає Claude Sonnet 4.5 — «найкращу в світі модель для програмування»
Компанія Anthropic випустила нову LLM-модель Claude Sonnet 4.5, яку описано як найкращу в світі модель для програмування та найпотужнішу модель для створення складних агентів. Також представлено SDK Claude Agent — набір інструментів, які допомагають розробникам створювати агентів на основі Claude Code.
За результатами бенчмарку SWE-bench Verified, яке вимірює реальні здібності до програмного кодування, Claude Sonnet 4.5 є лідером з показником 82%. По бенчмарку OSWorld, який тестує моделі штучного інтелекту на реальних комп’ютерних завданнях, Sonnet 4.5 теж лідирує з 61,4%.
Anthropic стверджує, що Claude Sonnet 4.5 під час тестування автономно працювала 30 годин, написавши 11 000 рядків коду для створення чат-додатку, подібного до Slack або Teams.
Модель також демонструє покращені можливості в широкому спектрі завдань, включаючи міркування та математику.
Що стосується інших оновлень:
Модель Claude Sonnet 4.5 вже доступна для використання через Claude API. Ціна залишається такою ж, як і у Claude Sonnet 4, і становить $3/$15 за мільйон токенів.
Компанія Google оголосила про запуск Agent Development Kit (ADK), спеціально розробленого для мови програмування Java.…
Керівництво Європейського Союзу офіційно заявило про необхідність негайного зниження попиту на пальне. Для цього треба…
Компанія Google офіційно оголосила про впровадження обов’язкової підтримки 64-бітних архітектур для всіх застосунків платформи Wear…
Сьогодні більшість нових систем створюються з використанням контейнерів та хмарної інфраструктури. Але в реальному корпоративному…
Дослідники компанії Meta розробили новий підхід до використання великих мовних моделей (LLM) для аналізу програмного…
Нове дослідження від Google DeepMind попереджає: поки ми навчаємось працювати з автономними ШІ-агентами, які здатні…