Google відкрила для платних користувачів доступ до Gemini 3 Deep Think — нового лідера серед LLM
Компанія Google оголосила про запуск моделі штучного інтелекту Gemini 3 Deep Think. Вона використовує ще більше обчислювальних ресурсів та нових технологій порівняно з попереднім лідером — моделлю Gemini 3 Pro, пише Neowin.
Gemini 3 Deep Think значно краще вирішує складні математичні, наукові та логічні завдання. У Humanity’s Last Exam, одному з найскладніших галузевих бенчмарків для LLM-моделей, Gemini 3 Deep Think набрала 41%, встановивши найвищий показник. В ARC-AGI-2, ще одному бенчмарку, нова модель отримала 45,1% за виконання коду. У науковому бенчмарку GPQA Diamond показник становив 93,8%, що стало ще одним рекордом.
Новинка змогла досягти таких переконливих результатів, оскільки використовує розширені паралельні міркування для одночасного дослідження кількох гіпотез. Попередній версія Gemini з режимом Deep Think нещодавно отримала золоті медалі на Міжнародній математичній олімпіаді (IMO) та на світовому фіналі Міжнародного університетського конкурсу з програмування. Під час IMO моделі мали розв’язати задачі за дві 4,5-годинні екзаменаційні сесії без доступу до інструментів чи інтернету та написати докази природною мовою.
Gemini 3 Deep Think доступна для всіх передплатників Google AI Ultra у додатку Gemini. Активувати новий режим можна, вибравши в меню опцію Deep Think.
Нагадаємо, що кілька днів тому генеральний директор Google Сундар Пічаї порівняв вайб-кодинг з появою YouTube.
Рой Лі, засновник вірусного стартапу Cluely, визнав, що збрехав журналістам про $7 мільйонів річного доходу.…
Популярний ШІ-редактор коду Cursor від компанії Anysphere робить наступний крок у розвитку агентного програмування. Новий…
У найближчі місяці в застосунку «Дія» з'явиться кілька нових функцій, в тому числі опція бронювання…
Соціальна мережа X анонсувала оновлення інструментів монетизації для авторів контенту. Основна зміна полягає в тому,…
Статистичний аналіз зарплат українських розробників, найнятих на Djinni за три місяці зими, демонструє суперечливі дані.…
Коли цього тижня стався збій в роботі інструментів вайб-кодування Claude, деяким розробникам програмного забезпечення довелося…