Рубріки: Новини

Grok 4 перевершив PhD-рівень по всіх тестах, максимальний тариф коштує $300 щомісяця

Дмитро Сімагін

10.07.2025 11:00

Компанія xAI випустила Grok 4 — флагманську LLM-модель у сімействі Grok. Перші тести демонструють результати, які можна порівняти з рівнем PhD (доктор наук). Ілон Маск вже заявив, що Grok 4 — «найрозумніший штучний інтелект в історії людства».

Результати тестів Grok 4:

Новий рекорд на Humanity’s Last Exam — 50,7% при використанні багатоагентної архітектури.
Без багатоагентного режиму результат все одно вражає — 25%, що вище, ніж у інших LLM-моделей.
На AIME 25 (математична олімпіада) — 100% правильних відповідей.
На ARC-AGI-2 (тест на загальний штучний інтелект) — 16% (попередні лідери показували 12-13%).

Багатоагентний режим передбачає, що замість одного модуля штучного інтелекту Grok запускає кілька агентів, які працюють над завданням паралельно, порівнюють гіпотези і приходять до спільного рішення. Це нагадує командну роботу людей — підхід, який активно досліджується у контексті AGI.

Grok 4 матиме спеціалізований інструмент для роботи з кодом, функціонал якого схожий на конкурентів: GitHub Copilot і GPT-4 Code Interpreter.

Модель Grok 4 доступна в двох варіантах: базова версія, яка входить у вартість звичайної передплати на X Premium, та максимальна Grok 4 Heavy за $300 на місяць.

Наступна стаття Білл Гейтс: програмування залишиться на 100% людською професією навіть через століття »

попередня стаття « Після 30 місяців роботи над JIT-компілятором Python він все ще повільніший за інтерпретатор

Дмитро Сімагін

Теги: Grok 4xAI

10.07.2025 11:00

Останні статті

Новини

Microsoft теж виходить на ринок агентів. Зустрічайте Copilot Tasks

Microsoft анонсувала бета-версію нового інструмента штучного інтелекту під назвою Copilot Tasks. За словами компанії, він…

27.02.2026

Спецпроєкти

Магія інновацій: як перетворити щоденний догляд на справжнє мистецтво за допомогою смарт-девайсів

Весна 2026 року диктує нові правила турботи про себе, де технології стають не просто зручним…

27.02.2026

Новини

«Claude cпочатку відмовлявся та заперечував»: хакер змусив LLM стати його спільником у нападі на уряд Мексики

Невідомий хакер використав модель штучного інтелекту Claude для серії атак на державні установи Мексики. За…

27.02.2026

Новини

Google запускає Nano Banana 2: генерація зображень до 4К

Компанія Google представила Nano Banana 2 (офіційна назва — Gemini 3.1 Flash Image). Це нове…

27.02.2026

Новини

Google додає нові функції та вкладки в Translate

Google оголосила про масштабне оновлення свого сервісу перекладу, додаючи в Translate нові алгоритми штучного інтелекту…

27.02.2026

Новини

СБУ створила регіональні кіберцентри: чим вони займатимуться

Служба безпеки створила регіональні центри кібербезпеки в усіх областях України. Їхня мета полягає в завчасному…

26.02.2026

Grok 4 перевершив PhD-рівень по всіх тестах, максимальний тариф коштує $300 щомісяця

Схожі статті

Останні статті

Microsoft теж виходить на ринок агентів. Зустрічайте Copilot Tasks

Магія інновацій: як перетворити щоденний догляд на справжнє мистецтво за допомогою смарт-девайсів

«Claude cпочатку відмовлявся та заперечував»: хакер змусив LLM стати його спільником у нападі на уряд Мексики

Google запускає Nano Banana 2: генерація зображень до 4К

Google додає нові функції та вкладки в Translate

СБУ створила регіональні кіберцентри: чим вони займатимуться