Компания Google, как и любой другой техногигант, лихорадочно встраивает ИИ практически в каждый свой продукт, параллельно развивая собственную ИИ-модель. Спустя 10 месяцев после релиза Gemini 1.5 компания представила Gemini 2.0, и на текущий момент это самая мощная языковая модель Google. Правда она доступна в базовом исполнении Flash и всё ещё находится на стадии предварительного просмотра.
Gemini 2.0 Flash так же хороша, как и Gemini 1.5 Pro, поэтому можно считать это следующим уровнем при той же экономической эффективности, производительности и скорости. Она не только лучше справляется со старыми задачами, но и может выполнять новые. Например, генерировать изображения и аудио, предлагать новые мультимодальные возможности, которые закладывают основу для следующего большого шага в этой области — создания виртуальных агентов (Agentic AI).
Agentic AI относится к ИИ-ботам, которые могут выполнять действия от имени пользователя. Google демонстрирует один из них — Project Astra. Это визуальная система, которая может распознавать объекты, помогает ориентироваться в пространстве и сообщает, где находятся забытые очки. Google также запускает Project Mariner — агента, управляемого через экспериментальное расширение для Chrome, которое в буквальном смысле может использовать браузер для пользователя и выполнять задачи вместо него. Пока среди его возможностей — печатать, прокручивать страницу и выбирать активную вкладку в браузере. И он запрашивает у пользователей подтверждение перед выполнением определённых конфиденциальных действий. Есть также агент Jules, предназначенный для помощи разработчикам в поиске и исправлении кода с подключением в рабочий процесс GitHub и новый агент, который следит за происходящим на экране и помогает играть в видеоигры.
План Google относительно Gemini 2.0 заключается в том, чтобы использовать эту модель абсолютно везде. ИИ будет в поиске, чат-боте и приложении Gemini, а в дальнейшем — в других продуктах Google. Компания работала над тем, чтобы внедрить как можно больше функций в саму модель вместо того, чтобы запускать кучу отдельных продуктов. То есть главная цель — в создании максимально универсальной ИИ-модели. При этом, помимо старых проблем, возникают новые. Одна из них — риски безопасности, исходящие от агентов. Google принимает определённые меры предосторожности с Mariner и Astra, но предстоит провести больше исследований.
Gemini 2.0 пока находится на экспериментальной стадии, но модель уже можно использовать в приложении Gemini.