Рубріки: Новини

Експериментальна LLM-модель OpenAI досягла рівня переможця Міжнародної математичної олімпіади

Дмитро Сімагін

Експериментальна модель OpenAI досягла рівня золотої медалі на Міжнародній математичній олімпіаді (IMO), вирішивши п’ять із шести завдань і набравши 35 балів із 42 можливих, повідомляє Engadget. Ця подія вже названа «важливою віхою в розвитку штучного інтелекту», особливо в галузі логічного та творчого мислення.

За словами наукового співробітника OpenAI Александра Вея, який спеціалізується на великих мовних моделях і логічних завданнях, нова розробка компанії впоралася з одним із ключових завдань — вирішенням математичних задач, які вимагають не лише обчислень, а й нестандартного підходу.

IMO є одним із найпрестижніших змагань для школярів з усього світу. Учасники конкурсу вирішують складні завдання з алгебри та математичного аналізу. Цього року золоті медалі здобули лише 67 із 630 учасників, тобто близько 10%.

До цього часу штучний інтелект показував хороші результати в обробці великих даних і виконанні рутинних операцій, однак у завданнях, де вимагається творчий підхід або складні логічні міркування, він не досягав вершин. Нова модель OpenAI нарешті змогла наблизитися до рівня мислення людини, побудувавши суворі і логічно вивірені докази.

Вей підкреслив, що модель здатна створювати «складні та безпомилкові логічні аргументи на рівні професійних математиків». При цьому OpenAI не планує виводити продукт з таким рівнем математичної підготовки на ринок у найближчі кілька місяців. Нова версія GPT-5, хоча й покращиться в порівнянні з попередніми версіями, але вона не включатиме можливості, продемонстровані на олімпіаді.

Останні статті

Всюди брехня: розробник програми для обману на співбесідах визнав, що збрехав журналістам про свій дохід

Рой Лі, засновник вірусного стартапу Cluely, визнав, що збрехав журналістам про $7 мільйонів річного доходу.…

06.03.2026

Cursor запускає ще один інструмент агентного кодування — Automations

Популярний ШІ-редактор коду Cursor від компанії Anysphere робить наступний крок у розвитку агентного програмування. Новий…

06.03.2026

Нові функції «Дії»: бронювання працівників у розшуку та податкові знижки

У найближчі місяці в застосунку «Дія» з'явиться кілька нових функцій, в тому числі опція бронювання…

06.03.2026

X запускає новий варіант монетизації: «Ексклюзивні теми» з платним доступом

Соціальна мережа X анонсувала оновлення інструментів монетизації для авторів контенту. Основна зміна полягає в тому,…

06.03.2026

Зарплати українських розробників: наймів більше, але грошей менше

Статистичний аналіз зарплат українських розробників, найнятих на Djinni за три місяці зими, демонструє суперечливі дані.…

06.03.2026

«Вже не можу писати код вручну»: збій в роботі Claude викликав проблеми у деяких розробників

Коли цього тижня стався збій в роботі інструментів вайб-кодування Claude, деяким розробникам програмного забезпечення довелося…

06.03.2026