Forklog
2022-09-22 09:27:30

OpenAI представила систему распознавания речи Whisper

Организация OpenAI представила систему распознавания речи с открытым исходным кодом Whisper, обеспечивающую транскрипцию на нескольких языках. https://twitter.com/OpenAI/status/1572629923017400326 Согласно анонсу, для обучения модели использовали 680 000 часов многоязычных и мультизадачных данных, собранных из интернета. Благодаря этому система распознает уникальные акценты, фоновый шум и технический жаргон, заявили исследователи. Whisper транскрибирует аудиодорожку на английском языке с выраженным акцентом. Данные: OpenAI. По словам разработчиков, Whisper продемонстрировала хорошие результаты распознавания речи примерно на 10 языках. В компании считают, что модель пригодится исследователям ИИ, изучающим надежность, возможности, ограничения и предубеждения современных моделей. «Whisper также потенциально весьма полезен в качестве решения для автоматического распознавания речи для разработчиков, особенно для распознавания английской речи», — заявили в OpenAI. Исследователи признали, что модель имеет свои ограничения, особенно в области предсказания текста. Из-за использования «зашумленных» данных в наборе для обучения Whisper может включать в транскрипцию слова, которые на самом деле не были произнесены. Разработчики предположили, что это связано с попыткой системы предугадать следующее слово в аудио и расшифровать сам звук. Также Whisper не одинаково хорошо работает на разных языках. Система подвержена большему числу ошибок для тех носителей, чья речь недостаточно представлена в наборе обучающих данных. Исходный код модели доступен на GitHub. Напомним, в сентябре OpenAI разрешила редактировать лица в DALL-E 2. Однако разработчики запретили загружать в систему изображения известных людей. В январе организация представила менее токсичную версию GPT-3, которая производит меньше оскорбительных выражений, дезинформации и ошибок в целом. Подписывайтесь на новости ForkLog в Telegram: ForkLog AI — все новости из мира ИИ!

Get Crypto Newsletter
Read the Disclaimer : All content provided herein our website, hyperlinked sites, associated applications, forums, blogs, social media accounts and other platforms (“Site”) is for your general information only, procured from third party sources. We make no warranties of any kind in relation to our content, including but not limited to accuracy and updatedness. No part of the content that we provide constitutes financial advice, legal advice or any other form of advice meant for your specific reliance for any purpose. Any use or reliance on our content is solely at your own risk and discretion. You should conduct your own research, review, analyse and verify our content before relying on them. Trading is a highly risky activity that can lead to major losses, please therefore consult your financial advisor before making any decision. No content on our Site is meant to be a solicitation or offer.