Google обновляет Gemini: новый интерфейс и мощные ИИ-модели
Google представила значительные обновления для своего ИИ-помощника Gemini, которые включают полностью переработанный интерфейс и внедрение новых агентов и моделей искусственного интеллекта. Обновлённый чат-бот уже доступен для пользователей Android и iOS по всему миру.
Обновлённый дизайн и улучшенное взаимодействие
На ежегодной конференции для разработчиков Google I/O компания анонсировала новый дизайн-язык под названием "Neural Expressive". Он привнёс в приложение Gemini свежий интерфейс с новой типографикой, более плавными анимациями и тактильной обратной связью (вибрацией). Важным изменением стала интеграция функции Gemini Live непосредственно в основной интерфейс. Теперь пользователи могут легко переключаться между текстовым вводом и голосовым общением с чат-ботом, не нажимая отдельную кнопку.
Кроме того, Gemini теперь поддерживает региональные диалекты и формирует ответы не только в виде "стен текста", но и с использованием изображений, графиков и даже озвученных видеоматериалов. Это делает взаимодействие с искусственным интеллектом более наглядным и интуитивным.
Интеллектуальный помощник Daily Brief
Среди новинок — агент искусственного интеллекта Daily Brief. При активации эта функция в фоновом режиме собирает информацию из подключённых приложений пользователя, таких как Gmail (почтовый сервис Google) и Google Календарь. Затем она формирует краткое ежедневное резюме предстоящих дел и ожидающих сообщений. Daily Brief не только предоставляет обзор электронных писем и событий, но и способен расставлять приоритеты задач на день, исходя из поставленных целей, а также предлагать следующие шаги. Пользователи могут обучать агента, оценивая его ответы.
Daily Brief постепенно внедряется, начиная с США, в рамках подписок Google AI Plus, Pro и Ultra.
Модель Gemini Omni для видео
Ещё одной важной новинкой стала модель Gemini Omni, которая позволяет генерировать видеоконтент на основе текстовых запросов, изображений и загруженных видеофайлов. С её помощью можно изменять фон видео с помощью текстовой команды, применять различные эффекты и встроенные шаблоны. Модель также способна создавать персонализированные аватары, которые выглядят и звучат как сам пользователь, для интеграции в видеоролики.
Gemini Omni уже доступна всем подписчикам Google AI Plus, Pro и Ultra.
Персональный ИИ-агент Gemini Spark
Представлен также новый агент Gemini Spark, описываемый компанией как "персональный ИИ-агент, работающий 24/7". Он функционирует на базе модели Gemini 3.5 и глубоко интегрирован с приложениями Google Workspace, такими как Gmail, Google Документы и Google Презентации. Spark также может быть связан с другими популярными сервисами, включая Canva (графический редактор), OpenTable (сервис бронирования столиков) и Instacart (служба доставки продуктов).
Агент способен выполнять повторяющиеся задачи, например, ежемесячно анализировать выписки по кредитным картам на предмет скрытых подписок. Кроме того, с его помощью можно создавать комплексные рабочие процессы. Например, Spark может собирать заметки из электронной почты и чатов, составлять отчёт в Google Документах, а затем на основе этой информации формировать черновик письма для запуска нового проекта.
Gemini Spark сначала станет доступен тестировщикам на этой неделе, а затем постепенно появится у бета-подписчиков Google AI Ultra в США.
Gemini на macOS и усовершенствованные голосовые функции
Этим летом Google планирует выпустить приложение Gemini для операционной системы macOS, что расширит доступность помощника. Вместе с этим будут представлены новые голосовые возможности. Даже если пользователь использует слова-паразиты или эмоциональные междометия в своей речи, Gemini сможет преобразовывать сказанное в точные и лаконичные черновики, которые затем можно использовать для отчётов или электронных писем.
