Рубріки: Новини

Нова модель Claude 4.1 лідирує в кодуванні за кілька днів до виходу GPT-5

Дмитро Сімагін

06.08.2025 11:13

Компанія Anthropic випустила нову LLM-модель Claude Opus 4.1, яка є оновленням Claude Opus 4 для агентних завдань та кодування. Opus 4.1 вже доступна для платних користувачів Claude та в Claude Code, інформує блог Anthropic.

Доступ до моделі Claude Opus 4.1 також можна отримати через API, Amazon Bedrock та Vertex AI від Google Cloud. Вартість доступу така ж, як і в Opus 4.

Нова модель набрала 74,5% у SWE-bench Verified, широко відомому бенчмарку, який перевіряє здатність LLM вирішувати реальні проблеми програмної інженерії. Цей показник продуктивності перевершує модель OpenAI o3 з 69,1% та Gemini 2.5 Pro від Google з 67,2%, що закріплює лідируючі позиції Anthropic в кодуванні на базі штучного інтелекту.

За даними GitHub, модель Claude Opus 4.1 має особливо помітний приріст продуктивності в рефакторингу багатофайлового коду. Rakuten Group вважає, що Opus 4.1 чудово справляється з точним визначенням виправлень у великих кодових базах без внесення зайвих коригувань. Windsurf повідомляє, що Opus 4.1 забезпечує покращення порівняно з Opus 4 у своєму бенчмарку для молодших розробників, демонструючи приблизно такий самий стрибок продуктивності, який був під час переходу від Sonnet 3.7 до Sonnet 4.

Нагадаємо, що до кінця поточного тижня компанія OpenAI обіцяє випустити довгоочікувану новинку — фланманську LLM-модель GPT-5. Найбільшою інтригою є те, чи стане вона лідером у більшості бенчмарків, зважаючи на те, що Google та Anthropic протягом останніх 7 днів випустили оновлення своїх LLM.

Наступна стаття JetBrains відкриває доступ до Kineto — конструктора програм, який не потребує знання коду »

попередня стаття « Microsoft представила Project Ire — систему зворотного інжинірингу шкідливого ПЗ

Дмитро Сімагін

Теги: AnthropicClaudeLLM-модель

06.08.2025 11:13

Останні статті

Новини

НАТО роздає мільйони: шукають українські стартапи для розробки технології протидії БПЛА

Український кластер оборонних технологій Brave1 спільно з директоратом інновацій НАТО запускає перший конкурс у рамках…

25.03.2026

Новини

Visual Studio Code 1.113: нові теми оформлення, вкладені субагенти та додаткові налаштування ШІ

Microsoft представила свіжий реліз Visual Studio Code 1.113. В оновленні компанія внесла покращення в інтерфейс…

25.03.2026

Спецпроєкти

Наземний дрон мінер «Бандура» проти класичних методів мінування

Класичні методи мінування часто вимагають виходу людей у небезпечну зону, витрат часу на підхід/відхід та…

25.03.2026

Новини

Anthropic додає в Claude Code автоматичний режим

Компанія Anthropic додає в свій інструмент кодування Claude Code автоматичний режим, який працює як з…

25.03.2026

Новини

Справа не лише в конкуренції: OpenAI закриває Sora по іншій причині

Вчорашня новина про те, що OpenAI закриває генератор відео Sora, нова версія якого була представлена…

25.03.2026

Новини

Браузер Firefox тепер має вбудований безкоштовний VPN зі щомісячним лімітом даних 50 Гб

Компанія Mozilla робить крок у бік посилення приватності користувачів, анонсувавши безкоштовний вбудовний VPN-сервіс у новій…

25.03.2026

Нова модель Claude 4.1 лідирує в кодуванні за кілька днів до виходу GPT-5

Схожі статті

Останні статті

НАТО роздає мільйони: шукають українські стартапи для розробки технології протидії БПЛА

Visual Studio Code 1.113: нові теми оформлення, вкладені субагенти та додаткові налаштування ШІ

Наземний дрон мінер «Бандура» проти класичних методів мінування

Anthropic додає в Claude Code автоматичний режим

Справа не лише в конкуренції: OpenAI закриває Sora по іншій причині

Браузер Firefox тепер має вбудований безкоштовний VPN зі щомісячним лімітом даних 50 Гб