Рубріки: Новини

OpenAI наздоганяє Anthropic в якості коду: Codex має 74,3% успішності порівняно з 73,7% у Claude Code

Дмитро Сімагін

Агентний інструмент генерації коду Codex від компанії OpenAI наздоганяє за певними можливостями аналогічний продукт Claude Code від Anthropic. Нові дані демонструють, що розробники схвалили 74,3% коду, написаного Codex, що трохи вище за 73,7% успішності Claude Code з точки зору схвалення запитів на зміну коду (PR, pull request). Про це пише видання Seeking Alpha з посилання на The Information. 

Дані про успішність коду отримані під час аналізу понад 300 000 PR, зібраних стартапом Modu. Ця компанія допомагає розробникам програмного забезпечення отримувати доступ до кількох помічників з кодування, включаючи Codex, Claude Code, Cursor, Devin та інші.

Крім Modu, протягом останнього місяця розробники на X та Reddit — навіть у спільноті Claude Code, теж вказували на покращення продуктивності Codex. Однак, згідно зі звітом, Modu не враховувала в своїх бенчмарках GitHub Copilot та агента Google Jules.

Ключовою причиною покращення продуктивності штучного інтелекту OpenAI у сфері кодування є випуск GPT‑5-Codex минулого місяця. До цього релізу Codex мав показник 69% успішності для створеного коду.

Незважаючи на покращену продуктивність після останнього релізу, Codex все ще поступається Claude Code за обсягом використанням: відсоток об’єднаних PR, створених за допомогою Codex через Modu, становить 24,9% порівняно з 32,1% для Claude Code. Це більше на 5% порівняно з часом до випуску GPT-5-Codex.

Codex став краще розробляти план дій для складніших завдань кодування, і він дешевший, ніж Claude Code. Однак, вартість не є таким важливим фактором при виборі помічника з кодування. Розробники готові платити більше, оскільки багато хто з них вважає, що витрати з часом знизяться.

У звіті зазначається, що для CEO, чиї компанії використовують продукти на базі штучного інтелекту, дешевше платити за доступ до асистентів з кодування для підтримки роботи існуючих програмістів, ніж наймати більше людей.

 

Останні статті

Anthropic стверджує, що її нова модель Claude Opus 4.5 перевершує всіх в програмуванні

Anthropic випустила нову LLM-модель Claude Opus 4.5. Стверджується, що це найкраща модель у світі для…

25.11.2025

Китайський інструмент вайб-кодингу LingGuang обігнав за популярністю ChatGPT і Sora 2

Інструмент кодування LingGuang від китайської компанії Ant Group менше ніж за тиждень досяг першого мільйона…

24.11.2025

Microsoft і GitHub об’єднали свої інструменти пошуку багів

Microsoft та її дочірня компанія GitHub оголосили про інтеграцію інструментів Microsoft Defender for Cloud та…

24.11.2025

Андрей Карпати виклав LLM Council — інструмент, де моделі штучного інтелекту сперечаються між собою

Відомий ентузіаст штучного інтелекту, співзасновник OpenAI та винахідник терміну «вайб-кодинг» Андрей Карпати виклав у відкритий…

24.11.2025

ІТ-ФОП в Україні «живе» в середньому 4 роки, 16% припиняють діяльність протягом перших 12 місяців

У поточному році українські ІТ-ФОПи частіше припиняли діяльність, ніж відкривались. За даними Опендатабот, з січня…

24.11.2025

Робота Міжнародної асоціації криптографії заблокована: втратили ключ шифрування

Міжнародна асоціація криптологічних досліджень (IACR) повідомила про неможливість оголосити результати виборів нових членів правління та…

24.11.2025