Рубріки: Новини

Grok 4 перевершив PhD-рівень по всіх тестах, максимальний тариф коштує $300 щомісяця

Дмитро Сімагін

10.07.2025 11:00

Компанія xAI випустила Grok 4 — флагманську LLM-модель у сімействі Grok. Перші тести демонструють результати, які можна порівняти з рівнем PhD (доктор наук). Ілон Маск вже заявив, що Grok 4 — «найрозумніший штучний інтелект в історії людства».

Результати тестів Grok 4:

Новий рекорд на Humanity’s Last Exam — 50,7% при використанні багатоагентної архітектури.
Без багатоагентного режиму результат все одно вражає — 25%, що вище, ніж у інших LLM-моделей.
На AIME 25 (математична олімпіада) — 100% правильних відповідей.
На ARC-AGI-2 (тест на загальний штучний інтелект) — 16% (попередні лідери показували 12-13%).

Багатоагентний режим передбачає, що замість одного модуля штучного інтелекту Grok запускає кілька агентів, які працюють над завданням паралельно, порівнюють гіпотези і приходять до спільного рішення. Це нагадує командну роботу людей — підхід, який активно досліджується у контексті AGI.

Grok 4 матиме спеціалізований інструмент для роботи з кодом, функціонал якого схожий на конкурентів: GitHub Copilot і GPT-4 Code Interpreter.

Модель Grok 4 доступна в двох варіантах: базова версія, яка входить у вартість звичайної передплати на X Premium, та максимальна Grok 4 Heavy за $300 на місяць.

Наступна стаття Білл Гейтс: програмування залишиться на 100% людською професією навіть через століття »

попередня стаття « Після 30 місяців роботи над JIT-компілятором Python він все ще повільніший за інтерпретатор

Дмитро Сімагін

Теги: Grok 4xAI

10.07.2025 11:00

Останні статті

Новини

Штучний інтелект «поглинув» 500 000 вакансій програмістів. Чого чекати далі?

Дослідження економістів Федеральної резервної системи США Ліланда Крейна та Пола Сото свідчить про тектонічні зсуви…

14.04.2026

Новини

Українці майже наздогнали американців за показником активного використання штучного інтелекту

Згідно зі свіжим опитуванням Gallup, впровадження штучного інтелекту в США досягло історичного рубежу. Вперше в…

14.04.2026

Чому майбутнє розробки – за low-code: думка та кейси експерта

За даними фахівців у сфері корпоративного управління, IT повільно, але впевнено стає слабким місцем у…

14.04.2026

Новини

Rockstar Games відмовилась платити хакерам $200 000: викрадені дані злито в мережу (спойлер: нічого цікавого там немає)

Хакерське угруповання ShinyHunters оприлюднило частину викрадених корпоративних даних Rockstar Games. Це сталося після того, як…

14.04.2026

Новини

Microsoft розробляє власного локального агента — альтернативу OpenClaw

Компанія Microsoft продовжує агресивну експансію у сферу автономних ШІ-агентів. Згідно з останніми звітами, технологічний гігант…

14.04.2026

Новини

Ліміти запитів до LLM змушують розробників підлаштовувати свій робочий графік

Минув той час, коли співробітники підлаштовували свій день під графік роботи колег або дедлайни. Тепер…

14.04.2026

Grok 4 перевершив PhD-рівень по всіх тестах, максимальний тариф коштує $300 щомісяця

Схожі статті

Останні статті

Штучний інтелект «поглинув» 500 000 вакансій програмістів. Чого чекати далі?

Українці майже наздогнали американців за показником активного використання штучного інтелекту

Чому майбутнє розробки – за low-code: думка та кейси експерта

Rockstar Games відмовилась платити хакерам $200 000: викрадені дані злито в мережу (спойлер: нічого цікавого там немає)

Microsoft розробляє власного локального агента — альтернативу OpenClaw

Ліміти запитів до LLM змушують розробників підлаштовувати свій робочий графік