Рубріки: Новини

Google випустила модель для роботи з user-інтерфейсом Gemini 2.5 Computer Use

Дмитро Сімагін

Команда Google DeepMind представила нову LLM-модель Gemini 2.5 Computer Use. Вона здатна діяти в інтерфейсі сайту або програми. Доступ до новинки вже відкрито через Gemini API в Google AI Studio та Vertex AI. Також всі бажаючі можуть ознайомитись з Gemini 2.5 Computer Use на Browserbase. Про це пише Neowin.

Для роботи з моделлю потрібно надіслати текстове завдання, вхідні дані зі скріншотом екрану та історією попередніх кроків. Після цього LLM проаналізує отримані вхідні дані, згенерує відповідь та зробить новий скріншот. Потім цикл повторюється, поки завдання буде виконано. За це відповідає новий інструмент computer_use, доступний у Gemini API. 

Робота з Gemini 2.5 Computer Use поки можлива тільки в браузері — в Google пояснили, що для управління на рівні настільної ОС модель поки не оптимізована.

У демонстраціях Gemini 2.5 Computer Use справляється із заповненням форм, вибором пунктів у списках, авторизацією на сайтах, перенесенням даних між сервісами та організацією елементів на дошках. Google наголошує, що модель працює з реальними веб-сторінками, включаючи сторінки з доступом за логіном. Це може значно спростити автоматизацію корпоративних інтерфейсів та типові офісні завдання.

Якщо модель в чомусь не впевнена, вона може запросити підтвердження у користувача. Наприклад, воно знадобиться, якщо дія пов’язана з купівлею товару.

Поки Computer Use перебуває у стадії preview. Google попереджає, що фокус зміщений на стабільну роботу у браузері та безпеку: кожна дія моделі проходить зовнішню перевірку, небезпечні сценарії (обхід капчі, втручання у пристрої) блокуються. Плани подальшого розвитку новинки поки що не розкриваються.

Останні статті

Штучний інтелект «поглинув» 500 000 вакансій програмістів. Чого чекати далі?

Дослідження економістів Федеральної резервної системи США Ліланда Крейна та Пола Сото свідчить про тектонічні зсуви…

14.04.2026

Українці майже наздогнали американців за показником активного використання штучного інтелекту

Згідно зі свіжим опитуванням Gallup, впровадження штучного інтелекту в США досягло історичного рубежу. Вперше в…

14.04.2026

Чому майбутнє розробки – за low-code: думка та кейси експерта

За даними фахівців у сфері корпоративного управління, IT повільно, але впевнено стає слабким місцем у…

14.04.2026

Rockstar Games відмовилась платити хакерам $200 000: викрадені дані злито в мережу (спойлер: нічого цікавого там немає)

Хакерське угруповання ShinyHunters оприлюднило частину викрадених корпоративних даних Rockstar Games. Це сталося після того, як…

14.04.2026

Microsoft розробляє власного локального агента — альтернативу OpenClaw

Компанія Microsoft продовжує агресивну експансію у сферу автономних ШІ-агентів. Згідно з останніми звітами, технологічний гігант…

14.04.2026

Ліміти запитів до LLM змушують розробників підлаштовувати свій робочий графік

Минув той час, коли співробітники підлаштовували свій день під графік роботи колег або дедлайни. Тепер…

14.04.2026