Рубріки: Новини

Модель Gemini 2.5 Deep Think виграла чемпіонат з програмування, розв’язавши 10 з 12 завдань

Дмитро Сімагін

Компанія Google заявила, що її LLM-модель виграла світовий фінал Міжнародного конкурсу коледжів з програмування (ICPC), отримавши золоту медаль. За словами Google, це знаменує собою «значний крок на нашому шляху до загального штучного інтелекту». Про це пише Ars Technica.

Щороку тисячі програмістів з різних коледжів беруть участь у ICPC, намагаючись протягом п’яти годин вирішити складні завдання, пов’язані з кодуванням та алгоритмами. Це найбільші та найдовші змагання такого типу. Для участі в ICPC Google підключила Gemini 2.5 Deep Think до віддаленого онлайн-середовища, схваленого ICPC. Учасникам змагань було надано фору в 10 хвилин, перш ніж Gemini почне «думати».

На відміну від аналогічної Міжнародної математичної олімпіади (IMO), яка пройшла на початку цього року, компанія Google не створила спеціально навчену модель для ICPC. Gemini 2.5, яка брала участь у змаганні, — це та сама серійна модель, якою всі користуються в інших додатках Gemini. 

Після закінчення ліміту часу команді Gemini вдалося отримати правильні відповіді на 10 з 12 завдань, що принесло їй золоту медаль. Лише чотири з 139 «людських» команд змогли досягти такого ж результату.

На ICPC бали нараховуються лише за правильне розв’язання завдання з урахуванням витраченого часу. Команда Gemini швидко досягла вищих позицій у рейтингу, правильно виконавши 8 завдань лише за 45 хвилин. Після 677 хвилин змагання команда Gemini 2.5 Deep Think мала 10 правильних відповідей.

Останні статті

ChatGPT вдвічі балакучіший, ніж Stack Overflow. Це може бути проблемою

Середня відповідь LLM-моделі на запит, пов'язаний з кодом, становить близько 2000 символів, що набагато більше…

17.09.2025

Цього року 2,6% українських ІТ-компаній переїхали в інший регіон

З січня по серпень 2025 року 7988 українських компаній переїхали в інший регіон країни. ІТ-бізнес…

17.09.2025

Комітет зі стандартів C++ відмовився від спроб покращити безпеку мови за зразком Rust

Комітет зі стандартів C++ відмовився від пропозиції щодо створення суворо безпечної підмножини мови, незважаючи на…

17.09.2025

Google представила платіжний протокол для агентів

Google анонсувала запуск Agent Payments Protocol (AP2) — нового протоколу з відкритим кодом, який дозволяє…

17.09.2025

OpenAI обмежить доступ до ChatGPT для неповнолітніх

Генеральний директор OpenAI Сем Альтман пообіцяв суттєво змінити спосіб взаємодії ChatGPT з користувачами віком до…

17.09.2025

Розробник пояснив, чому React вбиває інновації у фронтенді

React, який вважається одним з найпопулярніших JavaScript-фреймворків, вже не перемагає за рахунок своїх технічних переваг.…

16.09.2025