Рубріки: Новини

Meta випустила Llama API, який забезпечує рекордну швидкість виведення даних

Дмитро Сімагін

На конференції LlamaCon компанія Meta зробила кілька анонсів та представила інструменти, які мають зробити сімейство LLM-моделей Llama доступнішими для розробників. Головною подією став запуск набору інструкцій Llama API, який вже доступний у вигляді обмеженої безкоштовної preview-версії. Про це повідомляє Neowin.

Llama API дозволяє розробникам використовувати в своїх програмах різні LLM-моделі Llama, включно з останніми: Llama 4 Scout та Llama 4 Maverick. Створення ключів API відбувається одним натисканням миші. Також у бібліотеку входять TypeScript SDK і Python SDK. Щоб розробникам було легше портувати програми на базі OpenAI, API Llama сумісний з OpenAI SDK.

Для забезпечення швидшого виведення даних для Llama API компанія Meta також співпрацює з Cerebras та Groq. Cerebras стверджує, що модель Llama 4 Cerebras в API може забезпечити швидкість генерації токенів до 18 разів швидше, ніж звичайні рішення на базі GPU від NVIDIA та інших. Згідно з сайтом бенчмаркінгу Artificial Analysis, рішення Cerebras забезпечує виведення зі швидкістю понад 2600 токенів/с для Llama 4 Scout, що набагато швидше порівняно з ChatGPT (130 токенів/с) і DeepSeek (25 токенів/с).

Також на конференції стало відомо, що Meta запустить окремий додаток на базі штучного інтелекту, щоб конкурувати з ChatGPT. Цей застосунок дозволяє користувачам отримувати доступ до Meta AI в додатку, подібному до ChatGPT та інших додатків-помічників AI.

Останні статті

Diia.City United закликала Верховну Раду врахувати потреби бізнесу й внести зміни в Defence City

Diia.City United закликає ґрунтовно переробити законопроєкт «Defence City» та під час другого читання врахувати потреби…

01.08.2025

Айтівець з SQUAD загинув разом із донькою та собакою внаслідок атаки на Київ 31 липня

Спеціаліст з ІТ-підтримки із SQUAD Віталій Рабощук, його 18-річна донька Влада та пес Спайк загинули,…

01.08.2025

Google випустила модель міркування Gemini Deep 2.5 Think, яка одночасно тестує кілька ідей

Команда Google DeepMind випустила Gemini 2.5 Deep Think — модель міркування, яка здатна відповідати на…

01.08.2025

Нова функція Android Studio автоматично виконує складні багатоетапні завдання кодування для кількох файлів

Google представила стабільний реліз нової функції Narwhal для Android Studio. Вона має режим агента Gemini,…

01.08.2025

OpenAI відключила функцію, яка дозволяла Google індексувати діалоги з ChatGPT

Дослідники помітили, що пошукова система Google почала індексувати публічні посилання на діалоги з ChatGPT, внаслідок…

01.08.2025

Багхантери залишаться в минулому: на зміну ручному пошуку багів приходять агенти

У кібербезпеці помічена нова тенденція: тепер уразливості в коді все частіше шукають не люди, а…

01.08.2025