Компанія Cursor представила Composer 2.5 — нову версію власної моделі для програмування, яка вже доступна в редакторі. Порівняно з Composer 2, нова модель суттєво краще справляється з тривалими завданнями, точніше слідує складним інструкціям і загалом приємніша у взаємодії.
На тесті Terminal-Bench 2.0, який імітує роботу в терміналі на реальних задачах, Composer 2.5 набрала 69,3% проти 61,7% у попередньої версії. За показником SWE-Bench Multilingual, де модель виправляє баги в open-source проектах різними мовами, — 79,8%, тоді як у Claude Opus 4.7 цей показник становить 80,5%, а у GPT-5.5 від OpenAI — 77,8%. Варто зазначити, що результати конкурентів Cursor брала з офіційних заяв розробників, а не вимірювала самостійно.
| Composer 2.5 | Opus 4.7 | GPT-5.5 | Composer 2 | |
|---|---|---|---|---|
| Terminal-Bench 2.0 | 69.3% | 69.4% | 82.7% | 61.7% |
| SWE-Bench Multilingual | 79.8% | 80.5% | 77.8% | 73.7% |
| CursorBench v3.1 (harder tasks) | 63.2% | 64.8% max61.6% xhigh (default) | 64.3% xhigh59.2% medium (default) | 52.2% |
На власному бенчмарку CursorBench v3.1 Composer 2.5 набрала 63,2% при вартості менше долара за задачу — тоді як Opus 4.7 витрачає на аналогічному завданні до $7. Базовий тариф моделі: $0,50 за мільйон вхідних токенів і $2,50 за мільйон вихідних. Є також швидший варіант із такою ж якістю за $3,00/$15,00 відповідно — саме він встановлений за замовчуванням. Протягом першого тижня ліміт використання подвоєно.
Що всередині моделі
Composer 2.5 побудована на тому самому відкритому чекпоінті, що й Composer 2 — Kimi K2.5 від китайської Moonshot AI. Навесні це стало причиною звинувачень у тому, що Cursor видає чужу модель за власну. Тепер компанія відповіла детальною статистикою: на базову Kimi припадає лише близько 15% усіх обчислень, тоді як решта 85% — це власне дообчислення та навчання з підкріпленням (RL).
Серед ключових технічних нововведень — метод цільового зворотного зв’язку у вигляді тексту під час RL-навчання. Ідея полягає в тому, щоб надавати підказки безпосередньо в тій точці траєкторії, де модель могла б діяти краще, а не орієнтуватися лише на загальну фінальну винагороду за весь сеанс. Крім того, Composer 2.5 навчалась на синтетичних задачах у 25 разів більше, ніж попередня версія.
Composer 2.5 — не фінальна мета. Cursor спільно зі SpaceX та xAI вже тренує значно більшу модель із нуля, використовуючи в 10 разів більше обчислень на кластері Colossus 2 з мільйоном прискорювачів рівня Nvidia H100. Саме від неї в компанії очікують справжнього стрибка в продуктивності, а не від версії 2.5.
Нагадаємо, що розробники Nvidia тепер створюють втричі більше коду, ніж до переходу на Cursor.
Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn
Компанія Sony офіційно оголосила про підвищення цін на підписку, яка надає доступ до онлайн-каталогу ігор…
Компанія SpaceX підняла ціни на основні тарифи супутникового інтернету Starlink. Підвищення, яке оголосили в США…
The world of events in 2026 is a fast-paced game. In conditions of staff shortages,…
Світ івентів у 2026 році – це гра на високих швидкостях. В умовах кадрового голоду,…
Федеральне журі в Окленді (Каліфорнія) оголосило рішення не на користь Ілона Маска в його гучному…
Соціальна мережа X тихо запровадила жорсткі обмеження для користувачів без платної підписки. Тепер власники безкоштовних…