Meta випустила нову серію великих мовних моделей Llama 4
Meta представила нову серію великих мовних моделей Llama 4: Scout, Maverick і Behemoth. Перші дві з них вже доступні для завантаження на llama.com і Hugging Face, повідомляє Neowin.
Llama 4 Scout — найменша модель у серії, яка містить 17 мільярдів активних параметрів із 16 експертами. Meta стверджує, що Scout є найкращою мультимодальною моделлю у своєму класі, перевершуючи Gemma 3, Gemini 2.0 Flash-Lite та Mistral 3.1 у стандартних тестах штучного інтелекту. Незважаючи на високу продуктивність, ця LLM-модель може працювати лише на одному графічному процесорі NVIDIA H100. Також Scout підтримує введення контексту до 10 мільйонів токенів, що значно більше, ніж в інших моделях цього рівня. Однак експерти поки не встигли оцінити ефективність такого великого контекстного вікна на реальних прикладах застосування.
Llama 4 Maverick — основна модель, яка також має 17 мільярдів активних параметрів, але масштабована до 128 експертів. Компанія Meta стверджує, що Maverick є найкращою мультимодальною моделлю у своїй категорії та перевершує GPT-4o та Gemini 2.0 Flash у галузевих тестах. Її експериментальна версія чату набрала 1417 балів на LMArena, займаючи друге місце серед усіх провідних LLM.
Llama 4 Behemoth — найбільша модель у лінійці, яка все ще перебуває на стадії розробки. Behemoth містить 288 мільярдів активних параметрів із 16 експертами. Згідно інформації Meta, ця масивна модель перевершує GPT-4.5, Claude Sonnet 3.7 і Gemini 2.0 Pro за кількома стандартними тестами штучного інтелекту.
Українські технологічні проєкти мають шанс заявити про себе на світовій арені. Відкрито прийом заявок на…
Корпорація Microsoft пропонує частині своїх досвідчених співробітників у США залишити посаду добровільно, запроваджуючи програму викупу…
Китайська компанія DeepSeek представила свій новий флагман — LLM-модель DeepSeek-V4. Рівно через рік після свого…
Китайський технологічний гігант Alibaba оголосив про масштабне розширення своєї присутності на ринку електроавтомобілів. Велика мовна…
Компанія Microsoft розширює застосування концепції під назвою Vibe Working (вайб-воркінг) та спеціального режиму роботи Agent…
Компанія OpenAI представила GPT-5.5 — нову LLM-модель, орієнтовану на виконання складних багатоетапних завдань з мінімальним…