Google Home отримує Gemini: опис камер реального часу
Google Home отримує велике оновлення з Gemini, яке тепер може словами описувати те, що показує жива трансляція з домашньої камери.
Gemini поступово заходить у сценарії «розумного дому» і тепер береться за найскладніше місце в цій екосистемі: відео. The Verge звернув увагу на апдейт, у якому асистент може «переказувати побачене з live-камери текстом», щоб власнику не доводилося щоразу відкривати трансляцію й «вчитуватися» в картинку. Формат виглядає як логічне продовження коротких описів подій зі сповіщень, але тепер фокус зсувається на живий потік.
Домашні камери зазвичай дають багато шуму: тіні, коти, машини під вікном. Люди або вимикають нотифікації, або звикають їх ігнорувати. Текстовий опис з боку моделі може перетворити «рух у кадрі» на більш придатну підказку на кшталт «людина біля дверей» чи «посилка на порозі» (приклади наводять західні оглядачі, але формулювання завжди залежатиме від сцени й якості картинки).
Описувати відео в реальному часі означає обробляти чутливі дані. Для користувача тут важать три речі: де саме відбувається обчислення (на пристрої чи в хмарі), чи зберігаються фрагменти, і як система поводиться з помилковими «висновками» моделі. У домашній безпеці хибне спрацювання лише дратує, а пропущена подія вже створює ризик. Тому запуск таких функцій зазвичай йде поетапно, з обмеженнями за мовами й регіонами.
Раніше вже писалося про перехід Google від Assistant до Gemini в різних продуктах і про те, як компанія збирає єдиний «мозок» для пошуку, Android та сервісів. Камери та дверні дзвінки лишалися складною зоною, бо там немає «запиту», є потік подій. Опис live-відео переводить цю зону в текст, а текст легко лягає в автоматизації та сценарії.
Google підтягує AI-функції в сегмент, де давно змагаються Amazon, Apple та виробники камер із власними застосунками. Якщо опис live-кадру запрацює стабільно, користувачі отримають швидший контроль без постійного перегляду відео, а виробники камер отримають новий аргумент у підписках та преміум-функціях.
Нагадаємо, що Google додає нові функції та вкладки в Translate.
Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn
Сучасні великі мовні моделі (LLM) досягли критичного рівня у сфері аналізу даних, що ставить під…
Колишній розробник Google Гері Шенг створив безкоштовний плагін Peon Ping, який підключається до Claude Code…
Схоже, проекти open source знайшли часткове вирішення однієї з найбільш болючих для себе проблем —…
Епоха бюджетних ноутбуків і ПК, ціна яких не перевищувала $500, стрімко відходить у минуле. Аналітична…
Правоохоронці Південної Кореї опинилися в центрі гучного скандалу. Невдовзі після того, як місцева поліція опублікувала…
Компанія Anthropic анонсувала нову функцію імпорту пам’яті. Вона дозволяє додавати в Claude діалоги користувача з…