Модель Gemini 2.5 Deep Think виграла чемпіонат з програмування, розв'язавши 10 з 12 завдань
Компанія Google заявила, що її LLM-модель виграла світовий фінал Міжнародного конкурсу коледжів з програмування (ICPC), отримавши золоту медаль. За словами Google, це знаменує собою «значний крок на нашому шляху до загального штучного інтелекту». Про це пише Ars Technica.
Щороку тисячі програмістів з різних коледжів беруть участь у ICPC, намагаючись протягом п’яти годин вирішити складні завдання, пов’язані з кодуванням та алгоритмами. Це найбільші та найдовші змагання такого типу. Для участі в ICPC Google підключила Gemini 2.5 Deep Think до віддаленого онлайн-середовища, схваленого ICPC. Учасникам змагань було надано фору в 10 хвилин, перш ніж Gemini почне «думати».
На відміну від аналогічної Міжнародної математичної олімпіади (IMO), яка пройшла на початку цього року, компанія Google не створила спеціально навчену модель для ICPC. Gemini 2.5, яка брала участь у змаганні, — це та сама серійна модель, якою всі користуються в інших додатках Gemini.
Після закінчення ліміту часу команді Gemini вдалося отримати правильні відповіді на 10 з 12 завдань, що принесло їй золоту медаль. Лише чотири з 139 «людських» команд змогли досягти такого ж результату.
На ICPC бали нараховуються лише за правильне розв’язання завдання з урахуванням витраченого часу. Команда Gemini швидко досягла вищих позицій у рейтингу, правильно виконавши 8 завдань лише за 45 хвилин. Після 677 хвилин змагання команда Gemini 2.5 Deep Think мала 10 правильних відповідей.
Google оголосила про масштабне оновлення AI Studio. Замість браузерної платформи для експериментів з моделями Gemini…
Стартап Anysphere, відомий своїм агентним редактором коду Cursor, представив оновлену модель кодування під назвою Composer…
Компанія Anthropic анонсувала новий інструмент Claude Code Channels, який вже встигли назвати «вбивцею OpenClaw». Завдяки…
Google додає роз'яснення щодо свого майбутнього плану посилити контроль над екосистемою Android. Починаючи з березня…
Хакерське угруповання APT28 (також відоме як Fancy Bear або Strontium), яке пов’язують із російським ГРУ,…
OpenAI планує об'єднати свій додаток ChatGPT, платформу кодування Codex та браузер в одну «суперпрограму» для…