Рубріки: Новини

Нова модель Claude 4.1 лідирує в кодуванні за кілька днів до виходу GPT-5

Дмитро Сімагін

Компанія Anthropic випустила нову LLM-модель Claude Opus 4.1, яка є оновленням Claude Opus 4 для агентних завдань та кодування. Opus 4.1 вже доступна для платних користувачів Claude та в Claude Code, інформує блог Anthropic. 

Доступ до моделі Claude Opus 4.1 також можна отримати через API, Amazon Bedrock та Vertex AI від Google Cloud. Вартість доступу така ж, як і в Opus 4.

Нова модель набрала 74,5% у SWE-bench Verified, широко відомому бенчмарку, який перевіряє здатність LLM вирішувати реальні проблеми програмної інженерії. Цей показник продуктивності перевершує модель OpenAI o3 з 69,1% та Gemini 2.5 Pro від Google з 67,2%, що закріплює лідируючі позиції Anthropic в кодуванні на базі штучного інтелекту.

За даними GitHub, модель Claude Opus 4.1 має особливо помітний приріст продуктивності в рефакторингу багатофайлового коду. Rakuten Group вважає, що Opus 4.1 чудово справляється з точним визначенням виправлень у великих кодових базах без внесення зайвих коригувань. Windsurf повідомляє, що Opus 4.1 забезпечує покращення порівняно з Opus 4 у своєму бенчмарку для молодших розробників, демонструючи приблизно такий самий стрибок продуктивності, який був під час переходу від Sonnet 3.7 до Sonnet 4.

Нагадаємо, що до кінця поточного тижня компанія OpenAI обіцяє випустити довгоочікувану новинку — фланманську LLM-модель GPT-5. Найбільшою інтригою є те, чи стане вона лідером у більшості бенчмарків, зважаючи на те, що Google та Anthropic протягом останніх 7 днів випустили оновлення своїх LLM.

 

Останні статті

Хакери розсилають українцям «повістки в суд» з домену UKR.NET

Команда реагування на кіберзагрози CERT-UA виявила низку хакерських атак, здійснених угрупуванням UAC-0099, метою яких є…

06.08.2025

JetBrains відкриває доступ до Kineto — конструктора програм, який не потребує знання коду

Компанія JetBrains відкрила ранній доступ до Kineto — нового конструктора на базі штучного інтелекту, який…

06.08.2025

Microsoft представила Project Ire — систему зворотного інжинірингу шкідливого ПЗ

Microsoft розробила систему штучного інтелекту, яка може самостійно, без допомоги людини, проводити зворотній інжиніринг та…

06.08.2025

OpenAI випустила GPT-OSS — першу LLM-модель з відкритим кодом з часів GPT-2

Компанія OpenAI вперше за шість років випустила модель з відкритим кодом. На ринок представили gpt-oss-120b…

06.08.2025

CEO GitHub Томас Домке застерігає розробників: «Або прийміть штучний інтелект, або забудьте про цю роботу»

Генеральний директор GitHub Томас Домке звернувся із застереженням до розробників програмного забезпечення: «Адаптуйтеся до штучного…

05.08.2025

ChatGPT тепер нагадуватиме про необхідність перерв у роботі

Чат-бот ChatGPT почав відображати користувачам ненав’язливі нагадування під час тривалих сеансів, щоб заохотити зробити перерву.…

05.08.2025