Рубріки: Новини

Cursor представляє Composer 2.5: працює як Claude Opus 4.7, але в 7 разів дешевше

Дмитро Сімагін

Компанія Cursor представила Composer 2.5 — нову версію власної моделі для програмування, яка вже доступна в редакторі. Порівняно з Composer 2, нова модель суттєво краще справляється з тривалими завданнями, точніше слідує складним інструкціям і загалом приємніша у взаємодії.

Результати бенчмарків

На тесті Terminal-Bench 2.0, який імітує роботу в терміналі на реальних задачах, Composer 2.5 набрала 69,3% проти 61,7% у попередньої версії. За показником SWE-Bench Multilingual, де модель виправляє баги в open-source проектах різними мовами, — 79,8%, тоді як у Claude Opus 4.7 цей показник становить 80,5%, а у GPT-5.5 від OpenAI — 77,8%. Варто зазначити, що результати конкурентів Cursor брала з офіційних заяв розробників, а не вимірювала самостійно.

Composer 2.5 Opus 4.7 GPT-5.5 Composer 2
Terminal-Bench 2.0 69.3% 69.4% 82.7% 61.7%
SWE-Bench Multilingual 79.8% 80.5% 77.8% 73.7%
CursorBench v3.1 (harder tasks) 63.2% 64.8%
max61.6%
xhigh (default)
64.3%
xhigh59.2%
medium (default)
52.2%

 

Головна перевага — ціна

На власному бенчмарку CursorBench v3.1 Composer 2.5 набрала 63,2% при вартості менше долара за задачу — тоді як Opus 4.7 витрачає на аналогічному завданні до $7. Базовий тариф моделі: $0,50 за мільйон вхідних токенів і $2,50 за мільйон вихідних. Є також швидший варіант із такою ж якістю за $3,00/$15,00 відповідно — саме він встановлений за замовчуванням. Протягом першого тижня ліміт використання подвоєно.

Що всередині моделі

Composer 2.5 побудована на тому самому відкритому чекпоінті, що й Composer 2 — Kimi K2.5 від китайської Moonshot AI. Навесні це стало причиною звинувачень у тому, що Cursor видає чужу модель за власну. Тепер компанія відповіла детальною статистикою: на базову Kimi припадає лише близько 15% усіх обчислень, тоді як решта 85% — це власне дообчислення та навчання з підкріпленням (RL).

Серед ключових технічних нововведень — метод цільового зворотного зв’язку у вигляді тексту під час RL-навчання. Ідея полягає в тому, щоб надавати підказки безпосередньо в тій точці траєкторії, де модель могла б діяти краще, а не орієнтуватися лише на загальну фінальну винагороду за весь сеанс. Крім того, Composer 2.5 навчалась на синтетичних задачах у 25 разів більше, ніж попередня версія.

Composer 2.5 — не фінальна мета. Cursor спільно зі SpaceX та xAI вже тренує значно більшу модель із нуля, використовуючи в 10 разів більше обчислень на кластері Colossus 2 з мільйоном прискорювачів рівня Nvidia H100. Саме від неї в компанії очікують справжнього стрибка в продуктивності, а не від версії 2.5.

Нагадаємо, що розробники Nvidia тепер створюють втричі більше коду, ніж до переходу на Cursor.

Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn

Останні статті

PlayStation Plus подорожчає: гравці розлючені, Sony пояснює це «ринковими умовами»

Компанія Sony офіційно оголосила про підвищення цін на підписку, яка надає доступ до онлайн-каталогу ігор…

19.05.2026

Starlink підвищує тарифи вперше з 2023 року: почнуть діяти з 18 червня

Компанія SpaceX підняла ціни на основні тарифи супутникового інтернету Starlink. Підвищення, яке оголосили в США…

19.05.2026

The Event Ecosystem in 2026: How to Escape Operational Hell and Sell Out Every Event

The world of events in 2026 is a fast-paced game. In conditions of staff shortages,…

19.05.2026

Екосистема івентів 2026: Як вийти з операційного пекла та створити Sold-out

Світ івентів у 2026 році – це гра на високих швидкостях. В умовах кадрового голоду,…

19.05.2026

Суд відхилив позов Ілона Маска проти OpenAI: мільярдер заявив, що не визнає поразки

Федеральне журі в Окленді (Каліфорнія) оголосило рішення не на користь Ілона Маска в його гучному…

19.05.2026

Соцмережа X обмежила дописи для тих, хто не купив «галочку»

Соціальна мережа X тихо запровадила жорсткі обмеження для користувачів без платної підписки. Тепер власники безкоштовних…

19.05.2026