Рубріки: Новини

Grok 4 перевершив PhD-рівень по всіх тестах, максимальний тариф коштує $300 щомісяця

Дмитро Сімагін

Компанія xAI випустила Grok 4 — флагманську LLM-модель у сімействі Grok. Перші тести демонструють результати, які можна порівняти з рівнем PhD (доктор наук). Ілон Маск вже заявив, що Grok 4 — «найрозумніший штучний інтелект в історії людства».

Результати тестів Grok 4:

  • Новий рекорд на Humanity’s Last Exam — 50,7% при використанні багатоагентної архітектури.
  • Без багатоагентного режиму результат все одно вражає — 25%, що вище, ніж у інших LLM-моделей.
  • На AIME 25 (математична олімпіада) — 100% правильних відповідей.
  • На ARC-AGI-2 (тест на загальний штучний інтелект) — 16% (попередні лідери показували 12-13%).

Багатоагентний режим передбачає, що замість одного модуля штучного інтелекту Grok запускає кілька агентів, які працюють над завданням паралельно, порівнюють гіпотези і приходять до спільного рішення. Це нагадує командну роботу людей — підхід, який активно досліджується у контексті AGI.

Grok 4 матиме спеціалізований інструмент для роботи з кодом, функціонал якого схожий на конкурентів: GitHub Copilot і GPT-4 Code Interpreter.

Модель Grok 4 доступна в двох варіантах: базова версія, яка входить у вартість звичайної передплати на X Premium, та максимальна Grok 4 Heavy за $300 на місяць.

Останні статті

Anthropic оновлює Claude Code до версії 2.1.0

Компанія Anthropic випустила Claude Code у версії 2.1.0, яка стала помітним оновленням цього популярного інструменту…

09.01.2026

Senior-розробник Microsoft дає поради, як програмісту вижити в епоху штучного інтелекту

Нандіта Гірі, 32-річна програмістка з головного офісу Microsoft у Редмонді поділилась порадами, як розробникам слід…

09.01.2026

EPAM заключає партнерство з Cursor для створення та масштабування команд ШІ-розробників

Одна з найбільших світових аутсорс-компаній EPAM Systems оголосила про стратегічне партнерство з Cursor. Мета співпраці…

09.01.2026

Штучний інтелект у Gmail тепер сам буде вирішувати, які листи вам показувати в першу чергу

Google вносить масштабні зміни в Gmail, інтегруючи в поштовий сервіс можливості штучного інтелекту на базі…

09.01.2026

Ілон Маск анонсував випуск Grok Code — нового інструменту для вайб-кодингу

Ілон Маск анонсував значне оновлення LLM-моделі Grok разом із новими продуктами, в тому числі інструментом…

09.01.2026

CEO Replit: завдяки вайб-кодуванню керівникам більше не потрібно благати програмістів про допомогу

Глава стартапу Replit, який відомий однойменним IDE, Амджад Масад заявив, що інструменти вайб-кодингу змінюють баланс…

08.01.2026