Рубріки: Новини

Нова модель Claude 4.1 лідирує в кодуванні за кілька днів до виходу GPT-5

Дмитро Сімагін

Компанія Anthropic випустила нову LLM-модель Claude Opus 4.1, яка є оновленням Claude Opus 4 для агентних завдань та кодування. Opus 4.1 вже доступна для платних користувачів Claude та в Claude Code, інформує блог Anthropic. 

Доступ до моделі Claude Opus 4.1 також можна отримати через API, Amazon Bedrock та Vertex AI від Google Cloud. Вартість доступу така ж, як і в Opus 4.

Нова модель набрала 74,5% у SWE-bench Verified, широко відомому бенчмарку, який перевіряє здатність LLM вирішувати реальні проблеми програмної інженерії. Цей показник продуктивності перевершує модель OpenAI o3 з 69,1% та Gemini 2.5 Pro від Google з 67,2%, що закріплює лідируючі позиції Anthropic в кодуванні на базі штучного інтелекту.

За даними GitHub, модель Claude Opus 4.1 має особливо помітний приріст продуктивності в рефакторингу багатофайлового коду. Rakuten Group вважає, що Opus 4.1 чудово справляється з точним визначенням виправлень у великих кодових базах без внесення зайвих коригувань. Windsurf повідомляє, що Opus 4.1 забезпечує покращення порівняно з Opus 4 у своєму бенчмарку для молодших розробників, демонструючи приблизно такий самий стрибок продуктивності, який був під час переходу від Sonnet 3.7 до Sonnet 4.

Нагадаємо, що до кінця поточного тижня компанія OpenAI обіцяє випустити довгоочікувану новинку — фланманську LLM-модель GPT-5. Найбільшою інтригою є те, чи стане вона лідером у більшості бенчмарків, зважаючи на те, що Google та Anthropic протягом останніх 7 днів випустили оновлення своїх LLM.

 

Останні статті

США скасовують принцип лотереї при видачі робочих віз H-1B: як це вплине на IT-фахівців

Міністерство внутрішньої безпеки США оголосило про скасування лотерейної системи при видачі іноземним працівникам робочих віз…

24.12.2025

В Україні офіційно затвердили День програміста: коли відзначати нове свято

Кабінет міністрів України погодив Указ президента Володимира Зеленського про появу нового професійного свята — Дня…

24.12.2025

Китай звинуватили в крадіжці у Samsung технології 10-нм DRAM

П'ять осіб, включно з колишніми керівниками та співробітниками Samsung Electronics, були заарештовані в Сеулі за…

24.12.2025

У Києві відбувся форум ветеранських IT-стартапів SKELAR Veteran Venture Program. Фіналісти отримали $44 000

21 грудня 2025 року у Києві відбувся SKELAR Veteran Venture Forum. Після повного циклу акселерації…

24.12.2025

Претендувати на віддалену роботу тепер можуть лише найбільш кваліфіковані співробітники

Сандер ван'т Норденде, генеральний директор компанії Randstad, яка щотижня працевлаштовує близько півмільйона працівників, заявив, що…

24.12.2025

Україна піднялась на 14 позицій у світовому рейтингу розвитку штучного інтелекту

Україна увійшла в Топ-40 світового рейтингу держав за рівнем розвитку штучного інтелекту. Аналітичний центр Oxford…

24.12.2025