Источник описывает computer use как встроенную возможность Gemini 3.5 Flash для агентных задач в браузере, мобильной и desktop-среде. Важная часть сигнала для AI-Ready — не только действие в интерфейсе, но и safeguards вокруг чувствительных действий.
Что произошло
24 июня 2026 года Google DeepMind опубликовал материал Introducing computer use in Gemini 3.5 Flash. Страница ведет к официальной статье Google Blog, где computer use описан как встроенная возможность Gemini 3.5 Flash.
Источник говорит, что разработчики могут использовать Gemini 3.5 Flash для агентов, которые видят, рассуждают и действуют в browser, mobile и desktop environments.
Кратко о новости
Главная новость не только в том, что модель может работать с интерфейсом. Важнее то, что вместе с этим появляются отдельные safeguards для enterprise-сценариев.
- Computer use теперь встроен в Gemini 3.5 Flash, а не представлен только как отдельная модель.
- Источник связывает capability с long-horizon и enterprise automation tasks, например continuous software testing и knowledge work в профессиональных приложениях.
- Google отдельно описывает targeted adversarial training для рисков prompt injection.
- Для enterprise-сценариев источник выделяет два optional safeguard systems: явное подтверждение чувствительных или необратимых действий и остановку задачи при обнаружении indirect prompt injection.
Сигнал
Computer-use agents становятся ближе к практической автоматизации: они могут видеть интерфейс и действовать в нем. Но чем ближе агент к реальным кнопкам, данным и системам, тем важнее не скорость действий, а границы: что можно делать сразу, что требует подтверждения и что должно остановить задачу.
Почему это важно
Для бизнеса интерфейсный агент опасен не потому, что он «слишком умный». Он опасен потому, что может выполнить реальное действие: отправить форму, изменить доступ, удалить запись, нажать не ту кнопку или последовать скрытой инструкции на странице.
Поэтому computer use нужно внедрять через тестовый контур. Сначала сценарии, затем разрешенные поверхности, затем запретные действия, затем подтверждение человеком и журнал результата.
Практический вывод
Если команда рассматривает computer-use agent, минимальный checklist должен быть таким:
- перечислить интерфейсы, где агент может работать;
- отделить read-only действия от write actions;
- вынести sensitive и irreversible actions в approval gate;
- добавить eval-сценарии для indirect prompt injection;
- логировать, кто запросил задачу и что агент сделал;
- запускать сначала на тестовых данных или sandbox-поверхности.
Границы сигнала
- Нельзя говорить, что computer use безопасен для любой бизнес-системы.
- Нельзя говорить, что optional safeguards снимают необходимость human approval.
- Нельзя превращать benchmark или vendor performance claims в независимую оценку AI-Ready.
- Нельзя рекомендовать production-внедрение без отдельного сценария, тестов и владельца риска.
Куда читать дальше
Этот сигнал ведет к Harness, Approval Gates, Eval Scenario и Source Evidence Policy. Эти страницы помогают описать, как агент действует в интерфейсе, где он останавливается и как команда проверяет результат.