Рубріки: Новини

Meta випустила Llama API, який забезпечує рекордну швидкість виведення даних

Дмитро Сімагін

На конференції LlamaCon компанія Meta зробила кілька анонсів та представила інструменти, які мають зробити сімейство LLM-моделей Llama доступнішими для розробників. Головною подією став запуск набору інструкцій Llama API, який вже доступний у вигляді обмеженої безкоштовної preview-версії. Про це повідомляє Neowin.

Llama API дозволяє розробникам використовувати в своїх програмах різні LLM-моделі Llama, включно з останніми: Llama 4 Scout та Llama 4 Maverick. Створення ключів API відбувається одним натисканням миші. Також у бібліотеку входять TypeScript SDK і Python SDK. Щоб розробникам було легше портувати програми на базі OpenAI, API Llama сумісний з OpenAI SDK.

Для забезпечення швидшого виведення даних для Llama API компанія Meta також співпрацює з Cerebras та Groq. Cerebras стверджує, що модель Llama 4 Cerebras в API може забезпечити швидкість генерації токенів до 18 разів швидше, ніж звичайні рішення на базі GPU від NVIDIA та інших. Згідно з сайтом бенчмаркінгу Artificial Analysis, рішення Cerebras забезпечує виведення зі швидкістю понад 2600 токенів/с для Llama 4 Scout, що набагато швидше порівняно з ChatGPT (130 токенів/с) і DeepSeek (25 токенів/с).

Також на конференції стало відомо, що Meta запустить окремий додаток на базі штучного інтелекту, щоб конкурувати з ChatGPT. Цей застосунок дозволяє користувачам отримувати доступ до Meta AI в додатку, подібному до ChatGPT та інших додатків-помічників AI.

Останні статті

Найкращий квартал року: експорт ІТ-послуг з України демонструє зростання

За підсумками вересня 2025 року обсяг IT-експорту з України становив $557 мільйонів, що на $17…

31.10.2025

Android-смартфони краще захищені від шахраїв, ніж iPhone — дослідження

Спільне дослідження компаній Google і YouGov доводить, що через гаджети на базі Android рідше трапляються…

31.10.2025

FAVBET Tech увійшов у топ-5 платників податків серед резидентів «Дія.City»

Українська ІТ-компанія FAVBET Tech увійшла до топ-5 найбільших платників податків серед резидентів «Дія.City» за підсумками…

31.10.2025

Розробники TikTok зекономили компанії $300 000 на рік: просто переписали код Go API на Rust

Розробники TikTok переписали критично важливі Go API на Rust, що призвело до подвійного збільшення продуктивності…

31.10.2025

OpenAI випустила інструмент Aardvark для пошуку вразливостей в коді

OpenAI представила Aardvark — новий агент штучного інтелекту на базі GPT-5, який допомагає розробникам шукати…

31.10.2025

Новий фреймворк Google ADK дозволяє створювати агентів на Python і Java

Компанія Google оновила фреймворк ADK (Agent Development Kit). Вперше представлений у квітні цього року, ADK…

31.10.2025