Forklog
2025-05-21 12:22:13

Google I/O 2025: $249,99 за ИИ-агента, видеогенераторы и ряд других инноваций

20 мая на конференции Google I/O 2025 корпорация представила ряд новых ИИ-продуктов, в том числе генератор изображений, видео, фильмов, переводчик в Google Meet и другие.  $249,99 за Google AI Ultra  Google запустила новый тарифный план AI Ultra за $249,99 в месяц. Он обеспечивает «высочайший уровень доступа» к ИИ-приложениям и сервисам корпорации. В подписке доступен новый видеогенератор Google Veo 3, приложение для создания фильмов Flow и мощная модель Gemini 2.5 Pro Deep Think (она пока не запущена).  Другие опции Google AI Ultra: увеличенные лимиты на платформе NotebookLM и Whisk; доступ к чат-боту Gemini в Chrome; агентские инструменты на базе технологии Project Mariner; YouTube Premium; 30 ТБ для хранения данных на Google Drive, Google Photos и Gmail. Один из агентских инструментов — режим Agent Mode. Он может просматривать веб-страницы, проводить исследования и интегрироваться с приложениями Google для выполнения определенных задач. Его запуск ожидается «в ближайшее время». «Ultra — это программа для тех, кто хочет быть на передовой искусственного интеллекта от Google», — заявил вице-президент Google Labs и Gemini Джош Вудворд. Подписка AI Ultra доступна пока только в США.  Google присоединилась к растущему списку компаний, запустивших дорогой план. В декабре 2024 года OpenAI выпустила ChatGPT Pro за $200 в месяц. В апреле аналогичный ценник на Max установил ИИ-стартап Anthropic. Veo 3 — видео со звуком Veo 3 — новая ИИ-модель для генерации видео и звукового сопровождения вроде эффектов, шума и диалогов. Корпорация подчеркнула превосходство продукта над предыдущей версией Veo 2 по качеству создаваемых работ.  «Впервые мы выходим из эпохи молчания в создании видео. [Вы можете дать Veo 3] промпт для характеристик персонажей и окружения и предложить диалог с описанием того, как он должен звучать», — заявил CEO Google DeepMind Демис Хассабис.  cooking up something tasty for tomorrow... pic.twitter.com/wyIRMsXkFG— Demis Hassabis (@demishassabis) May 19, 2025 Нейросеть доступна в приложении Gemini для подписчиков тарифного плана Google AI Ultra.  Вероятно, появление Veo 3 стало возможно благодаря работе DeepMind в соответствующей области. В июне прошлого года ИИ-подразделение Google начало разработку технологии на базе искусственного интеллекта для генерации саундтреков к видео. Для Veo 2 также представлены улучшения — ей теперь можно предоставлять изображения персонажей, сцен, объектов и стилей для улучшения согласованности. Она умеет понимать движения камеры, способна добавлять или удалять объекты из ролика и расширять кадры клипов — например, превращать вертикальное видео в горизонтальное. Новые функции Veo 2 станут доступны на платформе Vertex AI. Imagen 4 — генератор картинок Google вывела на рынок новую ИИ-модель для создания изображений — Imagen 4. Она способна визуализировать мелкие детали, такие как ткани, капли воды и мех животных, и работать с фотореалистичными и абстрактными стилями.  Imagen 4 delivers visuals that pop with richer details, more nuanced color, and better text outputs.Everyone can make images for free in the Gemini App today: https://t.co/awhPeHZIqm#GoogleIO pic.twitter.com/nnI8ZGIELv— Google Gemini App (@GeminiApp) May 20, 2025 Нейросеть обеспечивает более высокое качество результатов по сравнению с Imagen 3 и создает иллюстрации с разным соотношением сторон и разрешением до 2K. «Мы также уделили много внимания улучшению генерации текста и типографии, так что модель отлично подходит для создания слайдов, приглашений или любых других материалов, где нужно сочетать изображения и текст», — подчеркнул Вудворд. Инструмент доступен в приложении Gemini, на платформах Google Whisk и Vertex AI, а также в Google Slides, Vids, Docs и других продуктах Google Workspace. Flow — генератор фильмов На конференции Google I/O 2025 компания анонсировала Flow — новую ИИ-модель для создания фильмов. В нее интегрированы три инструмента:  Veo для создания видео;  Imagen для генерации изображений; Gemini для работы с текстом и промптами. Introducing Flow: a new type of AI filmmaking tool that combines the best of Veo, Imagen and Gemini — built with and for creatives.Flow helps you maintain character and visual consistency from one clip to the next.See how emerging filmmakers are using it 🎥 pic.twitter.com/H0cBv6IGs1— Google (@Google) May 20, 2025 Flow позволяет импортировать персонажей или сцены или создавать эти элементы прямо внутри инструмента. Она предлагает функции управления камерой для смены угла обзора или ракурса, конструктор сцен и способы управления ассетами.  Помимо этого корпорация запускает Flow TV — ленту видеоклипов и контента с указанием точных промптов, использовавшихся для их создания. Сервис позволит понять творческий процесс авторов.  Смарт-очки Google включается в гонку смарт-очков, объявив о партнерстве с Gentle Monster и Warby Parker для создания гаджета на базе Android XR. Android XR — запущенная совместно с Qualcomm и Samsung в прошлом году платформа для работы устройств с расширенной реальностью (XR).  Компания сообщила об углублении партнерства с Samsung для развития XR-очков. Обе компании разрабатывают программную и аппаратную платформу. На конференции Google показала концепт очков на базе Android XR с искусственным интеллектом Gemini. Они оснащены камерой, микрофоном, динамиками и дисплеем для просмотра уведомления.  Google Android XR Glasses 👓 Live Demo#GoogleIO pic.twitter.com/qoGK4rs2z4— Ben Geskin (@BenGeskin) May 20, 2025 Google планирует выделить до $150 млн на совместную с Warby Parker разработку ИИ-очков. $75 млн уже отправлены.  Интеграция Gemini в Chrome Корпорация объявила о запуске интеграции Gemini в Chrome. Пользователи получат доступ к ИИ-помощнику для работы в браузере. Он сможет понимать контекст страницы и выполнять разные задачи.  Gemini в Chrome доступен через ввод текста и с помощью голосовой команды. Начать общение с ИИ-помощником можно, нажав на значок Gemini в правом верхнем углу окна Chrome. Пример работы: пользователь может открыть страницу с рецептом бананового хлеба и попросить Gemini сделать его безглютеновым. Или использовать цифрового помощника для подбора растения в спальню в зависимости от условий освещения.  В будущем Gemini сможет работать сразу с несколькими вкладками, что позволит в том числе сравнивать два похожих товара с разных страниц или интернет-магазинов.  Переводчик в Google Meet В Google Meet добавили перевод речи в реальном времени. Компания использует большую языковую аудиомодель от DeepMind для обеспечения естественного разговора с собеседником на другом языке.  В ходе перевода сохраняются голос, интонация и выражение лица. Новая функция имеет множество вариантов применения. Например, англоговорящие внуки смогут общаться с испаноговорящими бабушками и дедушками, как и сотрудники крупной компании из разных регионов.  Корпорация утверждает, что задержка в ходе перевода очень мала, позволяя разговаривать сразу с несколькими людьми.  Данные: Google. В ходе разговора сохраняется передача оригинальной речи собеседника. Перевод накладывается поверх.  Улучшение чат-бота Gemini Google сообщила о нескольких обновлениях чат-бота Gemini. Среди них: более широкая доступность мультимодальных возможностей; обновленные ИИ-модели; передача видео с камеры или экрана смартфона и параллельное ведение устных бесед; прокладывание маршрута через Google Maps, создание событий в Google Calendar и списка дел в Google Tasks. На конференции Google объявила, что у Gemini теперь 400 миллионов активных пользователей в месяц. Корпорация также обновила Deep Research — инструмент для генерации подробных исследовательских отчетов. Пользователи могут загружать PDF-файлы и изображения, а сервис сопоставит их с общедоступной информацией для предоставления более персонализированной информации.  В будущем можно будет интегрировать Drive и Gmail в Deep Research.  Project Mariner — ИИ-агент для просмотра веб-страниц Google открыла экспериментального ИИ-агента Project Mariner для американских пользователей с подпиской Google AI Ultra. Также обновлен принцип его работы — теперь помощник способен выполнять до 10 задач одновременно.  Среди примеров возможностей Project Marine: ассистент способен купить билеты на бейсбольный матч или продукты онлайн. Пользователи общаются с агентом, а он сам посещает сайты и выполняет нужные действия. Они могут заниматься своими делами, пока помощник выполнит задачи в фоновом режиме. Другие решения Помимо вышеописанных продуктов Google также представила множество других. Среди них: Gemma 3n — ИИ-модель для «плавной» работы на телефонах, ноутбуках и планшетах, способную взаимодействовать с аудио, текстом, изображениями и видео; Stitch — инструмент для помощи в разработке фронтенда веб- и мобильных приложений, он способен создавать необходимые элементы интерфейса и код; добавление функции видеообзоров в NotebookLM — пользователи смогут превращать мультимедийные материалы в удобные для восприятия визуальные презентации; новые функции в ИИ-режиме Google Search для онлайн-покупателей, в том числе визуальную панель, персонализированные уведомления о ценах и виртуальные примерки; SynthID Detector — способен определить, было ли изображение, видео, аудио или фрагмент текста созданы с помощью ИИ-моделей компании; улучшенный режим рассуждений Deep Think для флагманской модели Gemini 2.5 Pro; новые ИИ-функции в Gmail, Google Docs и Google Vids для очистки сообщений, составления персонализированных писем или создания и редактирования контента. Напомним, в апреле стало известно о желании OpenAI приобрести браузер Chrome.

获取加密通讯
阅读免责声明 : 此处提供的所有内容我们的网站,超链接网站,相关应用程序,论坛,博客,社交媒体帐户和其他平台(“网站”)仅供您提供一般信息,从第三方采购。 我们不对与我们的内容有任何形式的保证,包括但不限于准确性和更新性。 我们提供的内容中没有任何内容构成财务建议,法律建议或任何其他形式的建议,以满足您对任何目的的特定依赖。 任何使用或依赖我们的内容完全由您自行承担风险和自由裁量权。 在依赖它们之前,您应该进行自己的研究,审查,分析和验证我们的内容。 交易是一项高风险的活动,可能导致重大损失,因此请在做出任何决定之前咨询您的财务顾问。 我们网站上的任何内容均不构成招揽或要约