Нова агентна модель GPT 5.1-Codex-Max може автономно писати код протягом 24 годин
OpenAI розпочала розгортання в інструменті Codex нової агентної моделі GPT 5.1-Codex-Max. У пості в X компанія заявила, що новинка може автономно працювати з кодом протягом кількох годин. Про це повідомляє Bleeping Computer.
На відміну від моделі GPT-5.1, яка оптимізована для досліджень та звичайної взаємодії на кшталт створення зображень, GPT‑5.1-Codex-Max призначена суто для кодування. Вона навчена працювати в кількох контекстних вікнах за допомогою методу стискання.
Завдяки стисканню GPT‑5.1-Codex-Max автоматично ущільнює сеанс роботи, коли він наближається до ліміту контекстного вікна, дозволяючи моделі працювати незалежно протягом довгого часу. Під час внутрішнього тестування виявилось, що GPT‑5.1-Codex-Max змогла працювати над завданнями більше 24 годин.
За даними компанії-розробника, GPT‑5.1-Codex-Max може працювати з мільйонами токенів в одному завданні. Крім того, нова модель швидша та ефективніша при використанні токенів, ніж базова модель GPT-5.1.
«GPT‑5.1-Codex-Max було навчено виконувати завдання з розробки програмного забезпечення в реальному світі, такі як створення PR, перевірка коду, фронтенд-кодування та система запитань і відповідей, і перевершує наші попередні моделі в багатьох оцінках передового кодування», — заявляють в OpenAI.
У бенчмарках нова модель GPT-5.1-Codex-Max досягла 77,9% на SWE-Bench Verified, 79,9% — на SWE-Lancer IC SWE та 58,1% — на TerminalBench 2.0.
Інструмент Codex, для якого призначена GPT‑5.1-Codex-Max, працює всередині терміналу, але розробники також можуть використовувати його у веб-версії після підключення до GitHub.
Компанія Anthropic випустила Claude Code у версії 2.1.0, яка стала помітним оновленням цього популярного інструменту…
Нандіта Гірі, 32-річна програмістка з головного офісу Microsoft у Редмонді поділилась порадами, як розробникам слід…
Одна з найбільших світових аутсорс-компаній EPAM Systems оголосила про стратегічне партнерство з Cursor. Мета співпраці…
Google вносить масштабні зміни в Gmail, інтегруючи в поштовий сервіс можливості штучного інтелекту на базі…
Ілон Маск анонсував значне оновлення LLM-моделі Grok разом із новими продуктами, в тому числі інструментом…
Глава стартапу Replit, який відомий однойменним IDE, Амджад Масад заявив, що інструменти вайб-кодингу змінюють баланс…