OpenAI випускає безкоштовну модель o3-mini, яка краща в кодуванні, ніж флагманська o1
OpenAI намагається перехопити ініціативу у китайської компанії DeepSeek випуском нової моделі міркування o3-mini. На відміну від інших сучасних моделей OpenAI, вона є безкоштовною для всіх користувачів сервісу, повідомляє ArsTechnica.
Як запевняють в блозі OpenAI, o3-mini «розширює межі можливостей маленьких моделей». Вона оптимізована для функцій STEM і демонструє «особливу силу в науці, математиці та кодуванні». Користувачі платних пакетів Plus і Team отримають підвищений ліміт використання: 150 повідомлень щодня, для безкоштовних користувачів кількість обмежена 100 запитами на день.
Під час використання o3-mini можна обрати три різні «варіанти міркування». Це дозволяє точно налаштувати баланс між затримкою та точністю залежно від завдання. Найнижчий з цих рівнів міркування в математичних тестах і тестах кодування можна порівняти з попередньою моделлю o1-mini. Однак найвищий рівень o3-mini відповідає або перевершує повноцінну модель o1 у тих же тестах.
Представники OpenAI стверджують, що тестувальники моделі повідомили про 39-відсоткове зменшення «значних помилок» при використанні o3-mini порівняно з o1-mini, і віддали перевагу відповідям o3-mini у 56% випадків. Середня версія o3-mini пропонує в середньому на 24% швидший час відгуку, ніж o1-mini — з 10,16 секунди до 7,7 секунди.
У тестах кодування o3-mini є найефективнішою моделлю, перевіреною SWEbench. Нова модель перевершує o1-high навіть при середніх зусиллях міркування, підкреслюючи свою ефективність у завданнях генерації коду.
Професійна розробка на базі Google Antigravity перетворюється на розкіш через різке скорочення безкоштовних лімітів та…
Китай намагається обмежити застосування автономних ШІ-агентів, які протягом останніх тижнів набули великої популярності серед користувачів.…
Компанія Google оголосила про запуск режима планування в своєму інструменті командного рядка Gemini CLI. У…
Впевненість фахівців у стабільності власних компаній стрімко тане. Це створює нові виклики для глобального ринку…
Компанія Perplexity запускає власного агента зі штучним інтелектом під назвою Personal Computer. Він працює на…
У магазині додатків Google Play з'явилася нова функція Game Trials. Вона надає можливість зіграти в…