Новини 03/04/2026 12:00

Зустрічайте Gemma 4: нове покоління відкритих моделей Google для автономного вайб-кодування

Автор новин

Компанія Google представила чотири відкриті моделі Gemma 4, кожна з яких відрізняється за кількістю параметрів: Effective 2B (E2B), Effective 4B (E4B), 26B Mixture of Experts (MoE) та 31B Dense.

Для пристроїв з обмеженими ресурсами, включно зі смартфонами, випущено моделі Effective на 2 та 4 мільярди параметрів. Більш потужні системи отримають 26 мільярдів параметрів для Mixture of Experts та 31 мільярд параметрів для Dense.

Результати тестування показали, що в рейтингу Arena AI (текст) 31-мільярдна та 26-мільярдна версії Gemma 4 посіли третє та шосте місця відповідно. При цьому вони обійшли інші відкриті моделі, які у 20 разів перевершують їх за розміром.

Контекстне вікно дозволяє вводити дані розміром до 256K токенів у більш потужних моделях та 128K у малих.

Gemma 4 випущені під ліцензією Apache 2.0, яка дозволяє вільно використовувати, змінювати, розповсюджувати та продавати будь-яке ПЗ, створене за допомогою цих систем. Попередні версії Gemma компанія зробила доступною через власну ліцензію Gemma. Поточна ліцензія надає користувачам більшу свободу для модифікацій.

«Ліцензія з відкритим вихідним кодом забезпечує основу для повної гнучкості розробників та цифрового суверенітету, надаючи вам повний контроль над вашими даними, інфраструктурою та моделями, – заявили в Google. — Вона дозволяє вільно створювати та безпечно розгортати програми у будь-якому середовищі, локальному чи хмарному». Випробувати моделі можна через платформи Hugging Face, Kaggle та Ollama.

Мультимодальність та Agentic AI

На відміну від попередніх ітерацій, Gemma 4 є нативно мультимодальною:

Зір та Аудіо: Моделі обробляють зображення, відео (зі змінною роздільною здатністю) та аудіо (ASR та переклад у реальному часі доступні в E2B/E4B).
Агентні можливості: Оптимізовано для складних логічних ланцюжків (Reasoning), виклику функцій (Function Calling) та генерації структурованого виводу (JSON).
Автономне кодування: Висока якість генерації коду в офлайн-режимі дозволяє використовувати моделі як локальні AI-асистенти.

Інтеграція та розгортання

Google забезпечує підтримку Gemma 4 «з коробки» у ключових екосистемах:

Android: Через AICore та ML Kit. Моделі працюють у 4 рази швидше за попередників і споживають на 60% менше заряду батареї.
Cloud Run: Підтримка серверлес-інференсу на GPU NVIDIA RTX 6000 (Blackwell).
Frameworks: Повна сумісність із JAX, PyTorch, Keras 3 та Hugging Face.
ADK (Agent Development Kit): Новий модульний фреймворк від Google для швидкого створення агентів на базі Gemma 4.

Gemma 4 — це перехід від простого чат-бота до локального інтелектуального агента. Завдяки високій щільності знань та підтримці інструментарію (tool-calling), вона стає ідеальним вибором для RAG-систем та складних автоматизацій на клієнтському боці.