Искусственный интеллект в структурной биологии не за горами

Машинное обучение изменит наше понимание сворачивания белков. И очень важно, чтобы все данные были открытыми. "Я не думал, что мы дойдем до этого при моей жизни". Так отреагировал один из руководителей исследований в области структурной биологии на публикацию на прошлой неделе результатов исследования, в котором

 

Искусственный интеллект / Биотехнологии
|

искусственный интеллект (ИИ) был использован для анализа структуры более чем 20 000 белков человека, а также почти всех известных белков, производимых 20 модельными организмами, такими как кишечная палочка, плодовые мушки и дрожжи, а также соевые бобы и азиатский рис. В общей сложности это около 365 000 расчетов.

Данные, впервые ставшие общедоступными (см. https://alphafold.ebi.ac.uk), были опубликованы в Интернете 22 июля исследователями из DeepMind, лондонской компании по разработке искусственного интеллекта, принадлежащей материнской компании Google, Alphabet, и Европейского института биоинформатики, расположенного в Европейской лаборатории молекулярной биологии (EBI-EMBL) недалеко от Кембриджа, Великобритания.

Команда DeepMind разработала инструмент машинного обучения под названием AlphaFold. Команда обучила эту программу на последовательностях ДНК, включая их эволюционную историю, и уже известных формах десятков из тысяч белков, содержащихся в общедоступной базе данных белков, размещенной исследователями EBI-EMBL. Неделей ранее DeepMind также выпустила исходный код AlphaFold и подробно описала, как программа была создана, в то же время исследователи из Университета Вашингтона в Сиэтле опубликовали подробности о другой программе определения структуры белков - вдохновленной AlphaFold - под названием RoseTTAFold3.

Открытие этого каталога прогнозных структур не было бы такой хорошей новостью, если бы данные и методология не были открытыми и свободно доступными. Структурные биологи и другие исследователи уже начинают использовать AlphaFold для получения более точных моделей белков, которые было трудно или невозможно охарактеризовать с помощью современных экспериментальных методов.

Ускорение анализа структуры
Возможность определения трехмерной формы, в которую складываются белки, является одной из нерешенных "великих задач" биологии с момента открытия в 1953 году структуры самой ДНК. До появления искусственного интеллекта определение структуры по последовательности занимало много времени, не говоря уже о трудоемком процессе, с малой гарантией получения точного результата. Новые данные все еще нуждаются в проверке и экспериментальном подтверждении. Но инструменты ИИ могут точно предсказывать структуру белков в течение нескольких минут или часов - по сравнению с месяцами или годами, которые раньше требовались для определения структуры одного или двух белков. А это открывает возможности для применения, например, в разработке ферментов для расщепления загрязнителей окружающей среды, таких как микропластик.

Прорыв прошлой недели зависел не только от обмена открытыми данными, но и от достижений в фундаментальной науке и технологии. С 1960-х годов структурные биологи работали над параллельными подходами к пониманию науки о сворачивании белков. Один из них предполагает сборку структур белков путем понимания лежащих в их основе физических сил. Другой пытается предсказать формы путем сравнения с близкородственными белками, используя эволюционную историю организма. Кроме того, важную роль играют технологии визуализации, начиная с рентгеновской кристаллографии и заканчивая криоэлектронной микроскопией.

В фундаментальной науке структурной биологии остаются нерешенными ключевые проблемы. Хотя ИИ в науке и технике хорошо справляется с получением точных результатов, он не может (по крайней мере, пока) объяснить, как и почему эти результаты возникли. Следует поздравить команды DeepMind, EBI-EMBL, Вашингтонского университета и других организаций с важнейшими прорывами. Но предстоит еще много работы, чтобы раскрыть науку - важнейшую биологию, химию и физику - о том, как и почему формируются белки.

Государственные и частные
С точки зрения значимости, некоторые сравнивают последние достижения с первым проектом последовательности генома человека 20 лет назад. И это правда, что сравнивать есть с чем. И проект "Геном человека", и каталог предсказаний структуры белков человека, созданный компанией DeepMind, дают в руки инструмент, который значительно ускорит открытия.

Первый проект генома человека был результатом гонки. Решение проблемы складывания белков также выиграло от своего рода соревнования - ежегодного мероприятия под названием "Критическая оценка предсказания структуры белка" (Critical Assessment of Protein Structure Prediction, или CASP), которое сыграло важную роль в достижении результата.

Современные исследовательские группы - точно так же, как и те, кто занимался изучением последовательности генома на ранних стадиях - нуждаются в открытом доступе к данным. Делая данные и методологию открытыми для всех, DeepMind теперь устанавливает эталон, который затруднит другим корпорациям в этой области, таким как Facebook и Microsoft, дальнейшие споры о запатентованных данных.

А что же в будущем? За последнюю неделю журнал Nature опросил около десятка исследователей в этой области. По общему мнению, еще слишком рано предсказывать, какое именно влияние окажет применение ИИ в науках о жизни, за исключением того, что любое влияние будет преобразующим.

Точное предсказание того, как ИИ изменит биологию, требует надежных исследовательских данных, которых у нас пока нет. Но в ИИ сообщество исследователей структурной биологии - и их коллеги в других областях - располагают огромным объемом свежих данных. В дополнение к исследованиям и данным, ИИ дает возможность увидеть модели организации и управления исследованиями, которые должны изучать университеты. Сегодняшним исследователям и будущим поколениям предстоит проделать большую работу.


Комментарии

Пока нет комментриев, будьте первым кто выскажется

Добавление комментария

Ваше имя
Почта
Комментарий
В рамках форума «Сильные идеи для нового времени», который проводят Агентство стратегических инициатив и Фонд Росконгресс, специалисты из Симферополя

Компании Amazon, Nvidia, DigitalGlobe и специальное подразделение Центрального разведывательного управления (ЦРУ) США CosmiQ Works начали работу над


Банк UBS (Швейцария) будет использовать искусственный интеллект для проведения консультаций среди своих клиентов. Банк уже


Корпорация Google для улучшения работы своей поисковой машины решила создать искусственный интеллект. Для этого она приобрела


К 2029 году компьютеры смогут освоить человеческий язык и превзойдут людей интеллектом. Об этом пишет The Independent,











РУбрики
все шаблоны для dle на сайте newtemplates.ru скачать