Meta випустила нову серію великих мовних моделей Llama 4
Meta представила нову серію великих мовних моделей Llama 4: Scout, Maverick і Behemoth. Перші дві з них вже доступні для завантаження на llama.com і Hugging Face, повідомляє Neowin.
Llama 4 Scout — найменша модель у серії, яка містить 17 мільярдів активних параметрів із 16 експертами. Meta стверджує, що Scout є найкращою мультимодальною моделлю у своєму класі, перевершуючи Gemma 3, Gemini 2.0 Flash-Lite та Mistral 3.1 у стандартних тестах штучного інтелекту. Незважаючи на високу продуктивність, ця LLM-модель може працювати лише на одному графічному процесорі NVIDIA H100. Також Scout підтримує введення контексту до 10 мільйонів токенів, що значно більше, ніж в інших моделях цього рівня. Однак експерти поки не встигли оцінити ефективність такого великого контекстного вікна на реальних прикладах застосування.
Llama 4 Maverick — основна модель, яка також має 17 мільярдів активних параметрів, але масштабована до 128 експертів. Компанія Meta стверджує, що Maverick є найкращою мультимодальною моделлю у своїй категорії та перевершує GPT-4o та Gemini 2.0 Flash у галузевих тестах. Її експериментальна версія чату набрала 1417 балів на LMArena, займаючи друге місце серед усіх провідних LLM.
Llama 4 Behemoth — найбільша модель у лінійці, яка все ще перебуває на стадії розробки. Behemoth містить 288 мільярдів активних параметрів із 16 експертами. Згідно інформації Meta, ця масивна модель перевершує GPT-4.5, Claude Sonnet 3.7 і Gemini 2.0 Pro за кількома стандартними тестами штучного інтелекту.
Керівна рада проекту Fedora затвердила правила, які регламентують використання інструментів на базі штучного інтелекту при…
Браузер на основі штучного інтелекту ChatGPT Atlas, який днями представила компанія OpenAI, виявився вразливим до…
Користувач форуму ResetEra помітив, що інструмент на базі штучного інтелекту Microsoft Gaming Copilot, який автоматично…
Розробник під ніком donno2048 знову побив власний рекорд, зумівши помістити легендарну онлайн-гру «Змійка» (Snake) в…
Microsoft оголосила про публічний попередній перегляд функції планування у Visual Studio. Компанія запевняє, що вона…
Черговий російський обстріл Харкова, який стався 22 жовтня, призвів до пошкодження будівлі Європейського інноваційного хабу,…