Forklog
2022-05-02 11:30:06

DeepMind представила визуальную языковую модель с 80 млрд параметров

ИИ-лаборатория DeepMind разработала семейство моделей Flamingo, выполняющих больший объем работы с менее дорогостоящим и трудоемким обучением. Introducing Flamingo 🦩: a generalist visual language model that can rapidly adapt its behaviour given just a handful of examples. Out of the box, it's also capable of rich visual dialog. Read more: https://t.co/xEzqTizoJQ 1/ pic.twitter.com/GjlnDzbyOQ— DeepMind (@DeepMind) April 28, 2022 Модель предназначена для комбинирования ввода текста и изображения, чтобы получить только текстовый ответ. Flamingo обучили на специальном датасете, созданном для мультимодальных исследований машинного обучения. Набор состоит из 185 млн изображений и 182 Гб текста, полученных из общедоступного интернета. Одним из компонентов Flamingo является предварительно обученная языковая модель Chinchilla LM с 70 млрд параметров. DeepMind «объединил» алгоритм с элементами визуального обучения. Также инженеры добавили «промежуточные компоненты новой архитектуры», которые сохраняют данные изолированными и замороженными, давая им 80-миллиардный параметр Flamingo VLM. «Одна модель Flamingo может достигать самых высоких результатов в широком спектре задач, конкурируя с подходами, требующими точной настройки для конкретной задачи на большем количестве примеров», — заявили разработчики. По словам представителей организации, Flamingo превосходит предыдущие подходы к обучению с использованием нескольких шагов. Также модель оказалась эффективнее точно настроенных алгоритмов, использующих большее количество данных. В перспективе Flamingo может уменьшить количество потребляемой энергии при обучении ИИ и снизить потребность в высокопроизводительном оборудовании. Однако в компании не раскрыли деталей, за счет чего они добились таких результатов. Разработчики подчеркнули, что Flamingo можно быстро адаптировать к условиям с ограниченными ресурсами и для задач с низким уровнем ресурсов вроде оценки предвзятости ИИ. Напомним, в апреле DeepMind представила языковую модель Chinchilla с 70 млрд параметров. В феврале британская ИИ-лаборатория показала инструмент AlphaCode, который самостоятельно умеет писать код. В декабре 2021 года DeepMind разработала большую языковую модель Gopher, содержащую 280 млрд параметров. Подписывайтесь на новости ForkLog в Telegram: ForkLog AI — все новости из мира ИИ!

获取加密通讯
阅读免责声明 : 此处提供的所有内容我们的网站,超链接网站,相关应用程序,论坛,博客,社交媒体帐户和其他平台(“网站”)仅供您提供一般信息,从第三方采购。 我们不对与我们的内容有任何形式的保证,包括但不限于准确性和更新性。 我们提供的内容中没有任何内容构成财务建议,法律建议或任何其他形式的建议,以满足您对任何目的的特定依赖。 任何使用或依赖我们的内容完全由您自行承担风险和自由裁量权。 在依赖它们之前,您应该进行自己的研究,审查,分析和验证我们的内容。 交易是一项高风险的活动,可能导致重大损失,因此请在做出任何决定之前咨询您的财务顾问。 我们网站上的任何内容均不构成招揽或要约