Forklog
2025-05-21 12:22:13

Google I/O 2025: $249,99 за ИИ-агента, видеогенераторы и ряд других инноваций

20 мая на конференции Google I/O 2025 корпорация представила ряд новых ИИ-продуктов, в том числе генератор изображений, видео, фильмов, переводчик в Google Meet и другие. $249,99 за Google AI Ultra Google запустила новый тарифный план AI Ultra за $249,99 в месяц. Он обеспечивает «высочайший уровень доступа» к ИИ-приложениям и сервисам корпорации. В подписке доступен новый видеогенератор Google Veo 3, приложение для создания фильмов Flow и мощная модель Gemini 2.5 Pro Deep Think (она пока не запущена). Другие опции Google AI Ultra: увеличенные лимиты на платформе NotebookLM и Whisk; доступ к чат-боту Gemini в Chrome; агентские инструменты на базе технологии Project Mariner; YouTube Premium; 30 ТБ для хранения данных на Google Drive, Google Photos и Gmail. Один из агентских инструментов — режим Agent Mode. Он может просматривать веб-страницы, проводить исследования и интегрироваться с приложениями Google для выполнения определенных задач. Его запуск ожидается «в ближайшее время». «Ultra — это программа для тех, кто хочет быть на передовой искусственного интеллекта от Google», — заявил вице-президент Google Labs и Gemini Джош Вудворд. Подписка AI Ultra доступна пока только в США. Google присоединилась к растущему списку компаний, запустивших дорогой план. В декабре 2024 года OpenAI выпустила ChatGPT Pro за $200 в месяц. В апреле аналогичный ценник на Max установил ИИ-стартап Anthropic. Veo 3 — видео со звуком Veo 3 — новая ИИ-модель для генерации видео и звукового сопровождения вроде эффектов, шума и диалогов. Корпорация подчеркнула превосходство продукта над предыдущей версией Veo 2 по качеству создаваемых работ. «Впервые мы выходим из эпохи молчания в создании видео. [Вы можете дать Veo 3] промпт для характеристик персонажей и окружения и предложить диалог с описанием того, как он должен звучать», — заявил CEO Google DeepMind Демис Хассабис. cooking up something tasty for tomorrow... pic.twitter.com/wyIRMsXkFG— Demis Hassabis (@demishassabis) May 19, 2025 Нейросеть доступна в приложении Gemini для подписчиков тарифного плана Google AI Ultra. Вероятно, появление Veo 3 стало возможно благодаря работе DeepMind в соответствующей области. В июне прошлого года ИИ-подразделение Google начало разработку технологии на базе искусственного интеллекта для генерации саундтреков к видео. Для Veo 2 также представлены улучшения — ей теперь можно предоставлять изображения персонажей, сцен, объектов и стилей для улучшения согласованности. Она умеет понимать движения камеры, способна добавлять или удалять объекты из ролика и расширять кадры клипов — например, превращать вертикальное видео в горизонтальное. Новые функции Veo 2 станут доступны на платформе Vertex AI. Imagen 4 — генератор картинок Google вывела на рынок новую ИИ-модель для создания изображений — Imagen 4. Она способна визуализировать мелкие детали, такие как ткани, капли воды и мех животных, и работать с фотореалистичными и абстрактными стилями. Imagen 4 delivers visuals that pop with richer details, more nuanced color, and better text outputs.Everyone can make images for free in the Gemini App today: https://t.co/awhPeHZIqm#GoogleIO pic.twitter.com/nnI8ZGIELv— Google Gemini App (@GeminiApp) May 20, 2025 Нейросеть обеспечивает более высокое качество результатов по сравнению с Imagen 3 и создает иллюстрации с разным соотношением сторон и разрешением до 2K. «Мы также уделили много внимания улучшению генерации текста и типографии, так что модель отлично подходит для создания слайдов, приглашений или любых других материалов, где нужно сочетать изображения и текст», — подчеркнул Вудворд. Инструмент доступен в приложении Gemini, на платформах Google Whisk и Vertex AI, а также в Google Slides, Vids, Docs и других продуктах Google Workspace. Flow — генератор фильмов На конференции Google I/O 2025 компания анонсировала Flow — новую ИИ-модель для создания фильмов. В нее интегрированы три инструмента: Veo для создания видео; Imagen для генерации изображений; Gemini для работы с текстом и промптами. Introducing Flow: a new type of AI filmmaking tool that combines the best of Veo, Imagen and Gemini — built with and for creatives.Flow helps you maintain character and visual consistency from one clip to the next.See how emerging filmmakers are using it 🎥 pic.twitter.com/H0cBv6IGs1— Google (@Google) May 20, 2025 Flow позволяет импортировать персонажей или сцены или создавать эти элементы прямо внутри инструмента. Она предлагает функции управления камерой для смены угла обзора или ракурса, конструктор сцен и способы управления ассетами. Помимо этого корпорация запускает Flow TV — ленту видеоклипов и контента с указанием точных промптов, использовавшихся для их создания. Сервис позволит понять творческий процесс авторов. Смарт-очки Google включается в гонку смарт-очков, объявив о партнерстве с Gentle Monster и Warby Parker для создания гаджета на базе Android XR. Android XR — запущенная совместно с Qualcomm и Samsung в прошлом году платформа для работы устройств с расширенной реальностью (XR). Компания сообщила об углублении партнерства с Samsung для развития XR-очков. Обе компании разрабатывают программную и аппаратную платформу. На конференции Google показала концепт очков на базе Android XR с искусственным интеллектом Gemini. Они оснащены камерой, микрофоном, динамиками и дисплеем для просмотра уведомления. Google Android XR Glasses 👓 Live Demo#GoogleIO pic.twitter.com/qoGK4rs2z4— Ben Geskin (@BenGeskin) May 20, 2025 Google планирует выделить до $150 млн на совместную с Warby Parker разработку ИИ-очков. $75 млн уже отправлены. Интеграция Gemini в Chrome Корпорация объявила о запуске интеграции Gemini в Chrome. Пользователи получат доступ к ИИ-помощнику для работы в браузере. Он сможет понимать контекст страницы и выполнять разные задачи. Gemini в Chrome доступен через ввод текста и с помощью голосовой команды. Начать общение с ИИ-помощником можно, нажав на значок Gemini в правом верхнем углу окна Chrome. Пример работы: пользователь может открыть страницу с рецептом бананового хлеба и попросить Gemini сделать его безглютеновым. Или использовать цифрового помощника для подбора растения в спальню в зависимости от условий освещения. В будущем Gemini сможет работать сразу с несколькими вкладками, что позволит в том числе сравнивать два похожих товара с разных страниц или интернет-магазинов. Переводчик в Google Meet В Google Meet добавили перевод речи в реальном времени. Компания использует большую языковую аудиомодель от DeepMind для обеспечения естественного разговора с собеседником на другом языке. В ходе перевода сохраняются голос, интонация и выражение лица. Новая функция имеет множество вариантов применения. Например, англоговорящие внуки смогут общаться с испаноговорящими бабушками и дедушками, как и сотрудники крупной компании из разных регионов. Корпорация утверждает, что задержка в ходе перевода очень мала, позволяя разговаривать сразу с несколькими людьми. Данные: Google. В ходе разговора сохраняется передача оригинальной речи собеседника. Перевод накладывается поверх. Улучшение чат-бота Gemini Google сообщила о нескольких обновлениях чат-бота Gemini. Среди них: более широкая доступность мультимодальных возможностей; обновленные ИИ-модели; передача видео с камеры или экрана смартфона и параллельное ведение устных бесед; прокладывание маршрута через Google Maps, создание событий в Google Calendar и списка дел в Google Tasks. На конференции Google объявила, что у Gemini теперь 400 миллионов активных пользователей в месяц. Корпорация также обновила Deep Research — инструмент для генерации подробных исследовательских отчетов. Пользователи могут загружать PDF-файлы и изображения, а сервис сопоставит их с общедоступной информацией для предоставления более персонализированной информации. В будущем можно будет интегрировать Drive и Gmail в Deep Research. Project Mariner — ИИ-агент для просмотра веб-страниц Google открыла экспериментального ИИ-агента Project Mariner для американских пользователей с подпиской Google AI Ultra. Также обновлен принцип его работы — теперь помощник способен выполнять до 10 задач одновременно. Среди примеров возможностей Project Marine: ассистент способен купить билеты на бейсбольный матч или продукты онлайн. Пользователи общаются с агентом, а он сам посещает сайты и выполняет нужные действия. Они могут заниматься своими делами, пока помощник выполнит задачи в фоновом режиме. Другие решения Помимо вышеописанных продуктов Google также представила множество других. Среди них: Gemma 3n — ИИ-модель для «плавной» работы на телефонах, ноутбуках и планшетах, способную взаимодействовать с аудио, текстом, изображениями и видео; Stitch — инструмент для помощи в разработке фронтенда веб- и мобильных приложений, он способен создавать необходимые элементы интерфейса и код; добавление функции видеообзоров в NotebookLM — пользователи смогут превращать мультимедийные материалы в удобные для восприятия визуальные презентации; новые функции в ИИ-режиме Google Search для онлайн-покупателей, в том числе визуальную панель, персонализированные уведомления о ценах и виртуальные примерки; SynthID Detector — способен определить, было ли изображение, видео, аудио или фрагмент текста созданы с помощью ИИ-моделей компании; улучшенный режим рассуждений Deep Think для флагманской модели Gemini 2.5 Pro; новые ИИ-функции в Gmail, Google Docs и Google Vids для очистки сообщений, составления персонализированных писем или создания и редактирования контента. Напомним, в апреле стало известно о желании OpenAI приобрести браузер Chrome.