Рубріки: Новини

Зустрічайте Gemma 4: нове покоління відкритих моделей Google для автономного вайб-кодування

Андрій Савчук

Компанія Google представила чотири відкриті моделі Gemma 4, кожна з яких відрізняється за кількістю параметрів: Effective 2B (E2B), Effective 4B (E4B), 26B Mixture of Experts (MoE) та 31B Dense. 

Для пристроїв з обмеженими ресурсами, включно зі смартфонами, випущено моделі Effective на 2 та 4 мільярди параметрів. Більш потужні системи отримають 26 мільярдів параметрів для Mixture of Experts та 31 мільярд параметрів для Dense.

Результати тестування показали, що в рейтингу Arena AI (текст) 31-мільярдна та 26-мільярдна версії Gemma 4 посіли третє та шосте місця відповідно. При цьому вони обійшли інші відкриті моделі, які у 20 разів перевершують їх за розміром. 

Контекстне вікно дозволяє вводити дані розміром до 256K токенів у більш потужних моделях та 128K у малих.

Gemma 4 випущені під ліцензією Apache 2.0, яка дозволяє вільно використовувати, змінювати, розповсюджувати та продавати будь-яке ПЗ, створене за допомогою цих систем. Попередні версії Gemma компанія зробила доступною через власну ліцензію Gemma. Поточна ліцензія надає користувачам більшу свободу для модифікацій.

«Ліцензія з відкритим вихідним кодом забезпечує основу для повної гнучкості розробників та цифрового суверенітету, надаючи вам повний контроль над вашими даними, інфраструктурою та моделями, – заявили в Google. — Вона дозволяє вільно створювати та безпечно розгортати програми у будь-якому середовищі, локальному чи хмарному». Випробувати моделі можна через платформи Hugging Face, Kaggle та Ollama.

Мультимодальність та Agentic AI

На відміну від попередніх ітерацій, Gemma 4 є нативно мультимодальною:

  1. Зір та Аудіо: Моделі обробляють зображення, відео (зі змінною роздільною здатністю) та аудіо (ASR та переклад у реальному часі доступні в E2B/E4B).
  2. Агентні можливості: Оптимізовано для складних логічних ланцюжків (Reasoning), виклику функцій (Function Calling) та генерації структурованого виводу (JSON).
  3. Автономне кодування: Висока якість генерації коду в офлайн-режимі дозволяє використовувати моделі як локальні AI-асистенти.

Інтеграція та розгортання

Google забезпечує підтримку Gemma 4 «з коробки» у ключових екосистемах:

  • Android: Через AICore та ML Kit. Моделі працюють у 4 рази швидше за попередників і споживають на 60% менше заряду батареї.
  • Cloud Run: Підтримка серверлес-інференсу на GPU NVIDIA RTX 6000 (Blackwell).
  • Frameworks: Повна сумісність із JAX, PyTorch, Keras 3 та Hugging Face.
  • ADK (Agent Development Kit): Новий модульний фреймворк від Google для швидкого створення агентів на базі Gemma 4.

Gemma 4 — це перехід від простого чат-бота до локального інтелектуального агента. Завдяки високій щільності знань та підтримці інструментарію (tool-calling), вона стає ідеальним вибором для RAG-систем та складних автоматизацій на клієнтському боці.

Нагадаємо, нещодавно експерти попередили про небезпеку LLM-моделей з відкритим кодом.

Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn

Останні статті

WordPress тепер має безпечну альтернативу: Cloudflare представляє CMS EmDash

Компанія Cloudflare, найвідоміша в світі платформа для пом'якшення DDoS-атак, випустила Emdash — нову CMS, яку…

03.04.2026

Моделі штучного інтелекту брешуть не тільки заради себе, але й щоб врятувати інші LLM — дослідження

Моделі штучного інтелекту легко брешуть, щоб врятувати інші LLM, стверджують дослідники Центру відповідального децентралізованого інтелекту…

03.04.2026

Google випускає Agent Development Kit (ADK) для Java: новий рівень створення ШІ-агентів

Компанія Google оголосила про запуск Agent Development Kit (ADK), спеціально розробленого для мови програмування Java.…

02.04.2026

Європейців закликали масово переходити на дистанційну роботу

Керівництво Європейського Союзу офіційно заявило про необхідність негайного зниження попиту на пальне. Для цього треба…

02.04.2026

Google зобов’язує розробників програм для Wear OS перейти на 64-бітну архітектуру

Компанія Google офіційно оголосила про впровадження обов’язкової підтримки 64-бітних архітектур для всіх застосунків платформи Wear…

02.04.2026

Як почати розмовляти з legacy-інфраструктурою і спростити життя розробникам

Сьогодні більшість нових систем створюються з використанням контейнерів та хмарної інфраструктури. Але в реальному корпоративному…

02.04.2026