Forklog
2025-02-21 07:58:06

ИИ-модель Evo 2 обучили проектировать геномы

Исследователи Arc Institute разработали модель Evo 2, способную анализировать генетический код, прогнозировать заболевания и мутации, а также проектировать новые геномы длиной как у простых бактерий. Эксперты сотрудничают с Nvidia, Стэнфордским университетом, Калифорнийским университетом в Беркли и Калифорнийским университетом в Сан-Франциско. Их нейросеть обучена на ДНК более 100 000 видов. Код Evo 2 находится в открытом доступе на GitHub, а также интегрирован во фреймворк Nvidia BioNeMo. Arc Institute сотрудничал с исследовательской лабораторией искусственного интеллекта Goodfire для разработки визуализатора механистической интерпретируемости, который раскрывает ключевые биологические особенности и паттерны. Модель учится распознавать их в геномных последовательностях. «Evo 2 является крупнейшей на сегодняшний день ИИ-моделью в биологии, обученной на более чем 9,3 трлн нуклеотидов — строительных блоков, составляющих ДНК или РНК. [...] Evo 2 включает информацию о человеке, растениях и других одноклеточных и многоклеточных видах эукариотической области жизни», — говорится в объявлении. Нейросеть «обладает универсальным пониманием древа жизни», которое полезно для решения множества задач вроде предсказания мутаций и разработки кода для искусственной жизни.  «Эволюция закодировала биологическую информацию в ДНК и РНК, создав паттерны, которые Evo 2 может обнаружить и использовать», — подчеркнули авторы работы.  Для обучения ИИ применили более 2000 графических процессоров Nvidia H100. Она способна обрабатывать генетические последовательности до 1 млн нуклеотидов одновременно, что позволяет ей понимать взаимосвязи между удаленными частями генома. В тестах с вариантами гена BRCA1, связанного с раком молочной железы, Evo 2 с точностью более 90% предсказала, какие мутации являются доброкачественными, а какие — потенциально патогенными. Исследовательская группа считает, что на основе Evo 2 можно создавать более специфические ИИ-модели. Напомним, в июле 2024 года китайские ученые разработали робота с выращенным в лабораторных условиях искусственным мозгом, способного обучаться выполнению различных задач. Ранее Meta AI выпустила «модель белкового языка» ESM-2 с 15 млрд параметров и базу данных ESM Metagenomic Atlas, содержащую более 600 млн прогностических структур метагеномных соединений.

Get Crypto Newsletter
Read the Disclaimer : All content provided herein our website, hyperlinked sites, associated applications, forums, blogs, social media accounts and other platforms (“Site”) is for your general information only, procured from third party sources. We make no warranties of any kind in relation to our content, including but not limited to accuracy and updatedness. No part of the content that we provide constitutes financial advice, legal advice or any other form of advice meant for your specific reliance for any purpose. Any use or reliance on our content is solely at your own risk and discretion. You should conduct your own research, review, analyse and verify our content before relying on them. Trading is a highly risky activity that can lead to major losses, please therefore consult your financial advisor before making any decision. No content on our Site is meant to be a solicitation or offer.