Машинное обучение раскрывает рецепт создания искусственных белков

Машинное обучение раскрывает рецепт создания искусственных белков

Команда, возглавляемая исследователями из Школы молекулярной инженерии Притцкера в Чикагском университете, разработала процесс, основанный на искусственном интеллекте, который использует большие данные для разработки новых белков, — пишет eurekalert.org со ссылкой на Science.

Белки необходимы для жизни клеток — они выполняют сложные задачи и катализируют химические реакции. Ученые и инженеры долгое время стремились использовать эту мощь, создавая искусственные белки, которые могут выполнять новые задачи, такие как лечение болезней, захват углерода или сбор энергии, но многие процессы, предназначенные для создания таких белков, медленны и сложны.

Разрабатывая модели машинного обучения, которые могут просматривать информацию о белках, собранную из баз данных генома, исследователи нашли относительно простые правила проектирования для создания искусственных белков. Когда команда сконструировала эти искусственные белки в лаборатории, стало ясно, что сконструированные химические препараты могли конкурировать с теми, которые встречаются в природе.

«Нам всем было интересно, как простой эволюционный процесс мог привести к появлению такого высокопроизводительного материала, как белок, — сказал Рама Ранганатан — профессор Джозефа Регенштейна на кафедре биохимии и молекулярной биологии Школы молекулярной инженерии Притцкера. — Мы обнаружили, что данные генома содержат огромное количество информации об основных правилах структуры и функции белка, и теперь мы смогли воссоздать правила природы, чтобы самим создавать белки».

Белки состоят из сотен или тысяч аминокислот, и эти аминокислотные последовательности определяют структуру и функцию белка. Но понять, как создать эти последовательности для создания новых белков, было непросто. Прошлая работа привела к методам, которые могут определять структуру, но функция была более неуловимой.

За последние 15 лет Ранганатан и его сотрудники поняли, что базы данных генома, которые растут в геометрической прогрессии, содержат огромное количество информации об основных правилах структуры и функционирования белка. Его группа разработала математические модели на основе этих данных, а затем начала использовать методы машинного обучения, чтобы раскрыть новую информацию об основных правилах проектирования белков.

Для этого исследования они изучили семейство метаболических ферментов хоризмат мутазы — тип белка, который важен для жизни многих бактерий, грибов и растений. Используя модели машинного обучения, исследователи смогли выявить простые правила проектирования этих белков.

Модель показывает, что только сохранение в положениях аминокислот и корреляции в эволюции пар аминокислот достаточно для предсказания новых искусственных последовательностей, которые будут обладать свойствами семейства белков.

«Обычно мы предполагаем, что для того, чтобы что-то построить, нужно сначала глубоко понять, как это работает, — сказал Ранганатан. – Но, если у вас достаточно примеров данных, вы можете использовать методы глубокого обучения, чтобы выучить правила проектирования, даже если вы понимаете, как он работает или почему он построен таким образом».

Затем он и его сотрудники создали синтетические гены для кодирования белков, клонировали их в бактерии и наблюдали, как бактерии затем производили синтетические белки, используя свои обычные клеточные механизмы. Они обнаружили, что искусственные белки имеют ту же каталитическую функцию, что и природные белки хоризмат мутазы.

Поскольку правила проектирования настолько просты, количество искусственных белков, которые потенциально могут создать исследователи, чрезвычайно велико.

«Ограничения намного меньше, чем мы могли себе представить, — сказал Ранганатан. — В правилах проектирования природы простота, и мы считаем, что подобные подходы могут помочь нам найти модели для проектирования в других сложных биологических системах, таких как экосистемы или мозг».

Хотя искусственный интеллект раскрыл правила проектирования, Ранганатан и его сотрудники все еще не до конца понимают, почему модели работают. Им предстоит понять, как модели пришли к такому выводу. «Нужно проделать гораздо больше работы», — сказал он.

В то же время они надеются использовать эту платформу для разработки белков, которые могут решать насущные социальные проблемы, такие как изменение климата. Ранганатан и доц. Профессор Эндрю Фергюсон основал компанию Evozyne, которая будет коммерциализировать эту технологию, применяя ее в энергетике, окружающей среде, катализе и сельском хозяйстве. Ранганатан работал с Польским Центром Предпринимательства и Инноваций UChicago, чтобы подать патенты и лицензировать IP для компании.

«Эта система дает нам платформу для рациональной инженерии белковых молекул таким образом, о котором мы всегда мечтали, — сказал он. — Он не только может научить нас физике того, как белки работают и как они развиваются, он может помочь нам найти решения для таких проблем, как улавливание углерода и сбор энергии. Даже в более общем плане, исследования белков могут даже помочь нам научиться тому, как глубоко нейронные сети, стоящие за современным машинным обучением, действительно работают».

Иллюстрация к статье: Яндекс.Картинки

Читайте также

Оставить комментарий

Вы можете использовать HTML тэги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>