Рубріки: Новини

Meta випустила нову серію великих мовних моделей Llama 4

Дмитро Сімагін

Meta представила нову серію великих мовних моделей Llama 4: Scout, Maverick і Behemoth. Перші дві з них вже доступні для завантаження на llama.com і Hugging Face, повідомляє Neowin.

Llama 4 Scout — найменша модель у серії, яка містить 17 мільярдів активних параметрів із 16 експертами. Meta стверджує, що Scout є найкращою мультимодальною моделлю у своєму класі, перевершуючи Gemma 3, Gemini 2.0 Flash-Lite та Mistral 3.1 у стандартних тестах штучного інтелекту. Незважаючи на високу продуктивність, ця LLM-модель може працювати лише на одному графічному процесорі NVIDIA H100. Також Scout підтримує введення контексту до 10 мільйонів токенів, що значно більше, ніж в інших моделях цього рівня. Однак експерти поки не встигли оцінити ефективність такого великого контекстного вікна на реальних прикладах застосування.

Llama 4 Maverick — основна модель, яка також має 17 мільярдів активних параметрів, але масштабована до 128 експертів. Компанія Meta стверджує, що Maverick є найкращою мультимодальною моделлю у своїй категорії та перевершує GPT-4o та Gemini 2.0 Flash у галузевих тестах. Її експериментальна версія чату набрала 1417 балів на LMArena, займаючи друге місце серед усіх провідних LLM.

Llama 4 Behemoth — найбільша модель у лінійці, яка все ще перебуває на стадії розробки. Behemoth містить 288 мільярдів активних параметрів із 16 експертами. Згідно інформації Meta, ця масивна модель перевершує GPT-4.5, Claude Sonnet 3.7 і Gemini 2.0 Pro за кількома стандартними тестами штучного інтелекту.

Останні статті

Україна обирає представника для глобального фіналу Startup World Cup 2026 у Кремнієвій долині

Українські технологічні проєкти мають шанс заявити про себе на світовій арені. Відкрито прийом заявок на…

24.04.2026

Microsoft шукає «добровольців» на звільнення: пропонують річну зарплату, але не всім

Корпорація Microsoft пропонує частині своїх досвідчених співробітників у США залишити посаду добровільно, запроваджуючи програму викупу…

24.04.2026

DeepSeek випускає нову модель V4 Pro. Вона має 1,6 трильйона параметрів і дуже дешева

Китайська компанія DeepSeek представила свій новий флагман — LLM-модель DeepSeek-V4. Рівно через рік після свого…

24.04.2026

Audi та Volkswagen переходять на китайський штучний інтелект: Alibaba Qwen лідирує

Китайський технологічний гігант Alibaba оголосив про масштабне розширення своєї присутності на ринку електроавтомобілів. Велика мовна…

24.04.2026

Вайб-воркінг: Microsoft дозволить агентам працювати за вас у Word та Excel

Компанія Microsoft розширює застосування концепції під назвою Vibe Working (вайб-воркінг) та спеціального режиму роботи Agent…

24.04.2026

OpenAI повертає лідерство: GPT-5.5 випередила Claude Opus 4.7 у ключовому бенчмарку Terminal-Bench 2.0

Компанія OpenAI представила GPT-5.5 — нову LLM-модель, орієнтовану на виконання складних багатоетапних завдань з мінімальним…

24.04.2026