Рубріки: Новини

Експериментальна LLM-модель OpenAI досягла рівня переможця Міжнародної математичної олімпіади

Дмитро Сімагін

Експериментальна модель OpenAI досягла рівня золотої медалі на Міжнародній математичній олімпіаді (IMO), вирішивши п’ять із шести завдань і набравши 35 балів із 42 можливих, повідомляє Engadget. Ця подія вже названа «важливою віхою в розвитку штучного інтелекту», особливо в галузі логічного та творчого мислення.

За словами наукового співробітника OpenAI Александра Вея, який спеціалізується на великих мовних моделях і логічних завданнях, нова розробка компанії впоралася з одним із ключових завдань — вирішенням математичних задач, які вимагають не лише обчислень, а й нестандартного підходу.

IMO є одним із найпрестижніших змагань для школярів з усього світу. Учасники конкурсу вирішують складні завдання з алгебри та математичного аналізу. Цього року золоті медалі здобули лише 67 із 630 учасників, тобто близько 10%.

До цього часу штучний інтелект показував хороші результати в обробці великих даних і виконанні рутинних операцій, однак у завданнях, де вимагається творчий підхід або складні логічні міркування, він не досягав вершин. Нова модель OpenAI нарешті змогла наблизитися до рівня мислення людини, побудувавши суворі і логічно вивірені докази.

Вей підкреслив, що модель здатна створювати «складні та безпомилкові логічні аргументи на рівні професійних математиків». При цьому OpenAI не планує виводити продукт з таким рівнем математичної підготовки на ринок у найближчі кілька місяців. Нова версія GPT-5, хоча й покращиться в порівнянні з попередніми версіями, але вона не включатиме можливості, продемонстровані на олімпіаді.

Останні статті

Інструмент кодування Claude Code тепер доступний у веб- та мобільній версії

Інструмент агентного кодування Claude Code від компанії Anthropic став доступним у веб-версії та мобільному додатку.…

21.10.2025

JetBrains: для 90% програмістів інструменти ШІ економлять мінімум годину на тиждень, для 20% — цілий робочий день

Компанія JetBrains оприлюднила результати щорічного опитування Developer Ecosystem Survey про стан на ринку розробки програмного…

20.10.2025

Microsoft: фішинг за допомогою штучного інтелекту в 4,5 рази ефективніший за традиційний

Фішингові листи, створені за допомогою штучного інтелекту, більш успішні для хакерів у порівнянні з традиційними.…

20.10.2025

П’ять пасток, у які потрапляють навіть досвідчені проджект-менеджери. Колонка FAVBET Tech

Мабуть, у кожного проджекта є день, коли він ловить себе на думці: «Я більше координую…

20.10.2025

FAVBET Tech сплатив понад 650 млн грн податків за 9 місяців 2025 року

Українська ІТ-компанія FAVBET Tech за дев’ять місяців 2025 року перерахувала до державного бюджету понад 650…

20.10.2025

Telegram тестує функцію прямих ефірів з особистих акаунтів

Незабаром месенджер Telegram може поповнитись функцією трансляції прямих ефірів. Як повідомляє канал Telegram Info, у…

20.10.2025