Рубріки: Новини

Grok 4 перевершив PhD-рівень по всіх тестах, максимальний тариф коштує $300 щомісяця

Дмитро Сімагін

Компанія xAI випустила Grok 4 — флагманську LLM-модель у сімействі Grok. Перші тести демонструють результати, які можна порівняти з рівнем PhD (доктор наук). Ілон Маск вже заявив, що Grok 4 — «найрозумніший штучний інтелект в історії людства».

Результати тестів Grok 4:

  • Новий рекорд на Humanity’s Last Exam — 50,7% при використанні багатоагентної архітектури.
  • Без багатоагентного режиму результат все одно вражає — 25%, що вище, ніж у інших LLM-моделей.
  • На AIME 25 (математична олімпіада) — 100% правильних відповідей.
  • На ARC-AGI-2 (тест на загальний штучний інтелект) — 16% (попередні лідери показували 12-13%).

Багатоагентний режим передбачає, що замість одного модуля штучного інтелекту Grok запускає кілька агентів, які працюють над завданням паралельно, порівнюють гіпотези і приходять до спільного рішення. Це нагадує командну роботу людей — підхід, який активно досліджується у контексті AGI.

Grok 4 матиме спеціалізований інструмент для роботи з кодом, функціонал якого схожий на конкурентів: GitHub Copilot і GPT-4 Code Interpreter.

Модель Grok 4 доступна в двох варіантах: базова версія, яка входить у вартість звичайної передплати на X Premium, та максимальна Grok 4 Heavy за $300 на місяць.

Останні статті

Журналістка без досвіду в IT за два дні стала професійним вайб-кодером

Журналістка в якості експерименту провела два дні в офісі IT-компанії Notion, де спробувала себе у…

25.08.2025

Заснована українцями Grammarly збирається конкурувати з ChatGPT. Центром розробки стане Київ

Найбільший єдиноріг з українським корінням, Grammarly, незабаром змінить назву і перетвориться із сервісу перевірки граматики…

25.08.2025

13,4% українських айтівців готуються виїхати за кордон, 20% планують повернутись

48% українських IT-фахівців (у 2024 — 51%) готуються емігрувати або думають про це без наявності…

25.08.2025

Microsoft тестує функцію відновлення роботи Android-додатків у Windows 11

Компанія Microsoft почала тестувати нову функцію Windows 11, яка дозволяє переносити сеанс роботи з Android-програмою…

25.08.2025

Ілон Маск відкрив код Grok 2.5 і пообіцяв зробити те саме з Grok 3

Ілон Маск заявив, що його компанія xAI відкрила код LLM-моделі Grok 2.5. Завантажити її можна…

25.08.2025

CEO Coinbase звільнив програмістів, які не використовували штучний інтелект

Генеральний директор криптовалютної біржі Coinbase Браян Армстронг розповів, що нещодавно звільнив програмістів, які ще не…

22.08.2025