Рубріки: Новини

Meta випустила Llama API, який забезпечує рекордну швидкість виведення даних

Дмитро Сімагін

30.04.2025 12:31

На конференції LlamaCon компанія Meta зробила кілька анонсів та представила інструменти, які мають зробити сімейство LLM-моделей Llama доступнішими для розробників. Головною подією став запуск набору інструкцій Llama API, який вже доступний у вигляді обмеженої безкоштовної preview-версії. Про це повідомляє Neowin.

Llama API дозволяє розробникам використовувати в своїх програмах різні LLM-моделі Llama, включно з останніми: Llama 4 Scout та Llama 4 Maverick. Створення ключів API відбувається одним натисканням миші. Також у бібліотеку входять TypeScript SDK і Python SDK. Щоб розробникам було легше портувати програми на базі OpenAI, API Llama сумісний з OpenAI SDK.

Для забезпечення швидшого виведення даних для Llama API компанія Meta також співпрацює з Cerebras та Groq. Cerebras стверджує, що модель Llama 4 Cerebras в API може забезпечити швидкість генерації токенів до 18 разів швидше, ніж звичайні рішення на базі GPU від NVIDIA та інших. Згідно з сайтом бенчмаркінгу Artificial Analysis, рішення Cerebras забезпечує виведення зі швидкістю понад 2600 токенів/с для Llama 4 Scout, що набагато швидше порівняно з ChatGPT (130 токенів/с) і DeepSeek (25 токенів/с).

Також на конференції стало відомо, що Meta запустить окремий додаток на базі штучного інтелекту, щоб конкурувати з ChatGPT. Цей застосунок дозволяє користувачам отримувати доступ до Meta AI в додатку, подібному до ChatGPT та інших додатків-помічників AI.

Наступна стаття Розробники зляться, що JetBrains видаляє погані відгуки про AI Assistant »

попередня стаття « З 2024 року кількість додатків у Google Play зменшилася на 47%

Дмитро Сімагін

Теги: LLaMALlama APIMeta

30.04.2025 12:31

Останні статті

Новини

Вайб-кодування переходить на новий рівень: Google AI Studio стає повноцінним браузерним IDE

Google оголосила про масштабне оновлення AI Studio. Замість браузерної платформи для експериментів з моделями Gemini…

20.03.2026

Новини

Composer 2: в Cursor додали модель, яка випереджає Claude Opus 4.6

Стартап Anysphere, відомий своїм агентним редактором коду Cursor, представив оновлену модель кодування під назвою Composer…

20.03.2026

Новини

Anthropic запускає «вбивцю OpenClaw» — Claude Code Channels

Компанія Anthropic анонсувала новий інструмент Claude Code Channels, який вже встигли назвати «вбивцею OpenClaw». Завдяки…

20.03.2026

Новини

Google залишить можливість встановлювати неперевірені Android-додатки. Але з «режимом очікування»

Google додає роз'яснення щодо свого майбутнього плану посилити контроль над екосистемою Android. Починаючи з березня…

20.03.2026

Новини

Хакери використовують критичну вразливість Zimbra для атак на українські державні установи

Хакерське угруповання APT28 (також відоме як Fancy Bear або Strontium), яке пов’язують із російським ГРУ,…

20.03.2026

Новини

ChatGPT, браузер та Codex об’єднають в єдину суперпрограму для ПК

OpenAI планує об'єднати свій додаток ChatGPT, платформу кодування Codex та браузер в одну «суперпрограму» для…

20.03.2026

Meta випустила Llama API, який забезпечує рекордну швидкість виведення даних

Схожі статті

Останні статті

Вайб-кодування переходить на новий рівень: Google AI Studio стає повноцінним браузерним IDE

Composer 2: в Cursor додали модель, яка випереджає Claude Opus 4.6

Anthropic запускає «вбивцю OpenClaw» — Claude Code Channels

Google залишить можливість встановлювати неперевірені Android-додатки. Але з «режимом очікування»

Хакери використовують критичну вразливість Zimbra для атак на українські державні установи

ChatGPT, браузер та Codex об’єднають в єдину суперпрограму для ПК