Рубріки: Новини

OpenAI наздоганяє Anthropic в якості коду: Codex має 74,3% успішності порівняно з 73,7% у Claude Code

Дмитро Сімагін

Агентний інструмент генерації коду Codex від компанії OpenAI наздоганяє за певними можливостями аналогічний продукт Claude Code від Anthropic. Нові дані демонструють, що розробники схвалили 74,3% коду, написаного Codex, що трохи вище за 73,7% успішності Claude Code з точки зору схвалення запитів на зміну коду (PR, pull request). Про це пише видання Seeking Alpha з посилання на The Information. 

Дані про успішність коду отримані під час аналізу понад 300 000 PR, зібраних стартапом Modu. Ця компанія допомагає розробникам програмного забезпечення отримувати доступ до кількох помічників з кодування, включаючи Codex, Claude Code, Cursor, Devin та інші.

Крім Modu, протягом останнього місяця розробники на X та Reddit — навіть у спільноті Claude Code, теж вказували на покращення продуктивності Codex. Однак, згідно зі звітом, Modu не враховувала в своїх бенчмарках GitHub Copilot та агента Google Jules.

Ключовою причиною покращення продуктивності штучного інтелекту OpenAI у сфері кодування є випуск GPT‑5-Codex минулого місяця. До цього релізу Codex мав показник 69% успішності для створеного коду.

Незважаючи на покращену продуктивність після останнього релізу, Codex все ще поступається Claude Code за обсягом використанням: відсоток об’єднаних PR, створених за допомогою Codex через Modu, становить 24,9% порівняно з 32,1% для Claude Code. Це більше на 5% порівняно з часом до випуску GPT-5-Codex.

Codex став краще розробляти план дій для складніших завдань кодування, і він дешевший, ніж Claude Code. Однак, вартість не є таким важливим фактором при виборі помічника з кодування. Розробники готові платити більше, оскільки багато хто з них вважає, що витрати з часом знизяться.

У звіті зазначається, що для CEO, чиї компанії використовують продукти на базі штучного інтелекту, дешевше платити за доступ до асистентів з кодування для підтримки роботи існуючих програмістів, ніж наймати більше людей.

 

Останні статті

Чому сертифікована платформа швидше масштабується: технічний погляд та досвід команди SharksCode

Коли говорять про масштабування ІТ-продукту, зазвичай мають на увазі збільшення обсягу інфраструктури, щоб витримати більше…

27.02.2026

Китай розповсюджує теорію змови про «криптовалютну гегемонію» США

Китайський Національний центр реагування на комп’ютерні віруси (CVERC) оприлюднив звіт під гучною назвою «Top Player».…

27.02.2026

Григорович повернувся: найвідоміший український гейм-розробник анонсував новий проект S.T.R.A.N.G.E.R

Засновник відомої української геймдев-студії GSC Game World Сергій Григорович активно працює над новим проектом у…

27.02.2026

Microsoft теж виходить на ринок агентів. Зустрічайте Copilot Tasks

Microsoft анонсувала бета-версію нового інструмента штучного інтелекту під назвою Copilot Tasks. За словами компанії, він…

27.02.2026

Магія інновацій: як перетворити щоденний догляд на справжнє мистецтво за допомогою смарт-девайсів

Весна 2026 року диктує нові правила турботи про себе, де технології стають не просто зручним…

27.02.2026

«Claude cпочатку відмовлявся та заперечував»: хакер змусив LLM стати його спільником у нападі на уряд Мексики

Невідомий хакер використав модель штучного інтелекту Claude для серії атак на державні установи Мексики. За…

27.02.2026