Рубріки: Новини

Нова модель Claude 4.1 лідирує в кодуванні за кілька днів до виходу GPT-5

Дмитро Сімагін

Компанія Anthropic випустила нову LLM-модель Claude Opus 4.1, яка є оновленням Claude Opus 4 для агентних завдань та кодування. Opus 4.1 вже доступна для платних користувачів Claude та в Claude Code, інформує блог Anthropic. 

Доступ до моделі Claude Opus 4.1 також можна отримати через API, Amazon Bedrock та Vertex AI від Google Cloud. Вартість доступу така ж, як і в Opus 4.

Нова модель набрала 74,5% у SWE-bench Verified, широко відомому бенчмарку, який перевіряє здатність LLM вирішувати реальні проблеми програмної інженерії. Цей показник продуктивності перевершує модель OpenAI o3 з 69,1% та Gemini 2.5 Pro від Google з 67,2%, що закріплює лідируючі позиції Anthropic в кодуванні на базі штучного інтелекту.

За даними GitHub, модель Claude Opus 4.1 має особливо помітний приріст продуктивності в рефакторингу багатофайлового коду. Rakuten Group вважає, що Opus 4.1 чудово справляється з точним визначенням виправлень у великих кодових базах без внесення зайвих коригувань. Windsurf повідомляє, що Opus 4.1 забезпечує покращення порівняно з Opus 4 у своєму бенчмарку для молодших розробників, демонструючи приблизно такий самий стрибок продуктивності, який був під час переходу від Sonnet 3.7 до Sonnet 4.

Нагадаємо, що до кінця поточного тижня компанія OpenAI обіцяє випустити довгоочікувану новинку — фланманську LLM-модель GPT-5. Найбільшою інтригою є те, чи стане вона лідером у більшості бенчмарків, зважаючи на те, що Google та Anthropic протягом останніх 7 днів випустили оновлення своїх LLM.

 

Останні статті

Куди інвестують українці у 2025 році?

У новій економічній реальності українці дедалі активніше переосмислюють підходи до заощаджень і примноження капіталу. В…

25.09.2025

OpenAI тестує агента GPT-Alpha. Він буде самостійно писати, запускати та налагоджувати код

OpenAI проводить внутрішнє тестування нової версії агента, який використовує спеціальну версію GPT-5 під назвою GPT-Alpha.…

25.09.2025

Програмісти не цікавляться мобільним вайб-кодингом, незважаючи на наявність спеціалізованого софту

Технологія вайб-кодингу на мобільних пристроях поки не набула масового поширення. Незважаючи на численні спеціалізовані додатки,…

24.09.2025

Дві третини команд розробників використовують ШІ-інструменти, але продуктивність зросла лише на 10-15% — дослідження

Генеративний штучний інтелект у розробці програмного забезпечення не виправдовує того ажіотажу, який здійнявся навколо нього.…

24.09.2025

Google запускає в Україні пільговий тарифний план Google AI Plus

Компанія Google Україна запустила новий тарифний план Google AI Plus. Відтепер користувачі в Україні отримають…

24.09.2025

Платформу вайб-кодингу VibeSDK від CloudFlare перевели в open source

Компанія CloudFlare відкрила вихідний код VibeSDK — платформи для вайб-кодингу, яку тепер можна розгорнути одним…

24.09.2025