Google випустила мініатюрну модель Gemma 3 270M — її можна запустити на смартфоні
Google представила компактну версію своєї відкритої моделі Gemma, розроблену для роботи на локальних пристроях, включно з мобільними гаджетами. Архітектура Gemma 3 270M забезпечує високу продуктивність, особливо у випадках, коли важливі конфіденційність та при відсутності доступу до інтернету, повідомляє блог Google.
Моделі серії Gemma 3, випущені на початку цього року, містять від 1 до 27 мільярдів параметрів. У генеративному штучному інтелекті параметри – це вивчені змінні, які контролюють, як модель обробляє вхідні дані для оцінки вихідних токенів. Як правило, чим більше параметрів у моделі, тим краще вона працює. Маючи лише 270 мільйонів параметрів, нова Gemma 3 обмежена у виконанні деяких типів завдань, але її можна запускати смартфонах або навіть у веб-браузері.
Модель можна вбудовувати в програми або розгортати як частину хмарних сервісів. Оскільки Gemma 3 270M має відкриту ліцензію, Google не претендує на результати, згенеровані моделлю, що надає компаніям повні права на створений ними контент.
Під час тестування на пристрої Pixel 9 Pro нова Gemma 3 змогла виконати 25 діалогів, використавши лише 0,75% заряду батареї. Це робить її, безумовно, найефективнішою моделлю Gemma.
У тесті IFEval, який вимірює здатність моделі виконувати інструкції, Gemma 3 270M з налаштуванням інструкцій набрала 51,2%. Цей показник значно перевищує схожі малі моделі, такі як SmolLM2 135M Instruct та Qwen 2.5 0.5B Instruct, що робить її ближчою до діапазону продуктивності моделей з мільярдом параметрів.
Компанія Google оголосила про запуск Agent Development Kit (ADK), спеціально розробленого для мови програмування Java.…
Керівництво Європейського Союзу офіційно заявило про необхідність негайного зниження попиту на пальне. Для цього треба…
Компанія Google офіційно оголосила про впровадження обов’язкової підтримки 64-бітних архітектур для всіх застосунків платформи Wear…
Сьогодні більшість нових систем створюються з використанням контейнерів та хмарної інфраструктури. Але в реальному корпоративному…
Дослідники компанії Meta розробили новий підхід до використання великих мовних моделей (LLM) для аналізу програмного…
Нове дослідження від Google DeepMind попереджає: поки ми навчаємось працювати з автономними ШІ-агентами, які здатні…