Рубріки: Новини

Meta випустила нову серію великих мовних моделей Llama 4

Дмитро Сімагін

Meta представила нову серію великих мовних моделей Llama 4: Scout, Maverick і Behemoth. Перші дві з них вже доступні для завантаження на llama.com і Hugging Face, повідомляє Neowin.

Llama 4 Scout — найменша модель у серії, яка містить 17 мільярдів активних параметрів із 16 експертами. Meta стверджує, що Scout є найкращою мультимодальною моделлю у своєму класі, перевершуючи Gemma 3, Gemini 2.0 Flash-Lite та Mistral 3.1 у стандартних тестах штучного інтелекту. Незважаючи на високу продуктивність, ця LLM-модель може працювати лише на одному графічному процесорі NVIDIA H100. Також Scout підтримує введення контексту до 10 мільйонів токенів, що значно більше, ніж в інших моделях цього рівня. Однак експерти поки не встигли оцінити ефективність такого великого контекстного вікна на реальних прикладах застосування.

Llama 4 Maverick — основна модель, яка також має 17 мільярдів активних параметрів, але масштабована до 128 експертів. Компанія Meta стверджує, що Maverick є найкращою мультимодальною моделлю у своїй категорії та перевершує GPT-4o та Gemini 2.0 Flash у галузевих тестах. Її експериментальна версія чату набрала 1417 балів на LMArena, займаючи друге місце серед усіх провідних LLM.

Llama 4 Behemoth — найбільша модель у лінійці, яка все ще перебуває на стадії розробки. Behemoth містить 288 мільярдів активних параметрів із 16 експертами. Згідно інформації Meta, ця масивна модель перевершує GPT-4.5, Claude Sonnet 3.7 і Gemini 2.0 Pro за кількома стандартними тестами штучного інтелекту.

Останні статті

Мова програмування Rust оновлена до версії 1.93

Команда Rust оновила мову програмування до версії 1.93. Новий реліз, який має коміти від 406…

23.01.2026

«Дія» отримає функціонал для пошуку роботи

Кабінет міністрів України погодив пілотний проєкт, за яким послуги Центрів зайнятості будуть оцифровані через систему…

23.01.2026

Microsoft представляє новий інструмент WinApp CLI, який спрощує розробку програм для Windows

Microsoft анонсувала публічну попередню версію WinApp CLI, інтерфейсу командного рядка з відкритим вихідним кодом. WinApp…

23.01.2026

JetBrains інтегрувала Codex в свої IDE та показала, як з ним працювати

Інструмент кодування Codex тепер працює всередині чату JetBrains AI, що дає можливість використовувати його безпосередньо…

23.01.2026

Міноборони України разом з Palantir починає тестування військових моделей штучного інтелекту

Державна платформа військових технологій BRAVE1 разом з Міністерством оборони України та за підтримки американської компанії…

23.01.2026

«Вони використовували вайб-кодинг»: хакер створив каталог «небезпечних додатків»

Анонімний хакер запустив «магазин небезпечних iOS-додатків» — публічний реєстр програм, швидко створених за допомогою вайб-кодингу.…

22.01.2026