Зустрічайте Gemma 4: нове покоління відкритих моделей Google для автономного вайб-кодування
Компанія Google представила чотири відкриті моделі Gemma 4, кожна з яких відрізняється за кількістю параметрів: Effective 2B (E2B), Effective 4B (E4B), 26B Mixture of Experts (MoE) та 31B Dense.
Для пристроїв з обмеженими ресурсами, включно зі смартфонами, випущено моделі Effective на 2 та 4 мільярди параметрів. Більш потужні системи отримають 26 мільярдів параметрів для Mixture of Experts та 31 мільярд параметрів для Dense.
Результати тестування показали, що в рейтингу Arena AI (текст) 31-мільярдна та 26-мільярдна версії Gemma 4 посіли третє та шосте місця відповідно. При цьому вони обійшли інші відкриті моделі, які у 20 разів перевершують їх за розміром.

Контекстне вікно дозволяє вводити дані розміром до 256K токенів у більш потужних моделях та 128K у малих.
Gemma 4 випущені під ліцензією Apache 2.0, яка дозволяє вільно використовувати, змінювати, розповсюджувати та продавати будь-яке ПЗ, створене за допомогою цих систем. Попередні версії Gemma компанія зробила доступною через власну ліцензію Gemma. Поточна ліцензія надає користувачам більшу свободу для модифікацій.
«Ліцензія з відкритим вихідним кодом забезпечує основу для повної гнучкості розробників та цифрового суверенітету, надаючи вам повний контроль над вашими даними, інфраструктурою та моделями, – заявили в Google. — Вона дозволяє вільно створювати та безпечно розгортати програми у будь-якому середовищі, локальному чи хмарному». Випробувати моделі можна через платформи Hugging Face, Kaggle та Ollama.
Мультимодальність та Agentic AI
На відміну від попередніх ітерацій, Gemma 4 є нативно мультимодальною:
- Зір та Аудіо: Моделі обробляють зображення, відео (зі змінною роздільною здатністю) та аудіо (ASR та переклад у реальному часі доступні в E2B/E4B).
- Агентні можливості: Оптимізовано для складних логічних ланцюжків (Reasoning), виклику функцій (Function Calling) та генерації структурованого виводу (JSON).
- Автономне кодування: Висока якість генерації коду в офлайн-режимі дозволяє використовувати моделі як локальні AI-асистенти.
Інтеграція та розгортання
Google забезпечує підтримку Gemma 4 «з коробки» у ключових екосистемах:
- Android: Через AICore та ML Kit. Моделі працюють у 4 рази швидше за попередників і споживають на 60% менше заряду батареї.
- Cloud Run: Підтримка серверлес-інференсу на GPU NVIDIA RTX 6000 (Blackwell).
- Frameworks: Повна сумісність із JAX, PyTorch, Keras 3 та Hugging Face.
- ADK (Agent Development Kit): Новий модульний фреймворк від Google для швидкого створення агентів на базі Gemma 4.
Gemma 4 — це перехід від простого чат-бота до локального інтелектуального агента. Завдяки високій щільності знань та підтримці інструментарію (tool-calling), вона стає ідеальним вибором для RAG-систем та складних автоматизацій на клієнтському боці.
Нагадаємо, нещодавно експерти попередили про небезпеку LLM-моделей з відкритим кодом.
Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn












Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: