Ученые получили искусственные белки с помощью ИИ
Американские ученые разработали систему на основе искусственного интеллекта, которая способна генерировать последовательности белков. В лабораторных тестах они проявляют себя так же хорошо, как и натуральные, хотя их последовательность может быть не похожа ни на один известный в природе белок. Результаты работы опубликованы в журнале Nature Biotechnology.
Белки выполняют множество разных функций в организме, начиная от структурной и заканчивая каталитической. Последнюю выполняют специализированные белковые молекулы — ферменты, которые способны осуществлять множество важных реакций в клетках.
Американские ученые разработали систему на основе искусственного интеллекта, которую назвали ProGen. В ее основе лежит система для работы с естественными языками. Чтобы создать модель, ученые обучили ее с помощью 280 млн последовательностей разных белков. Затем они настроили ее, обучив с помощью 56 тысяч последовательностей белков из пяти семейств лизоцимов, также предоставив системе контекстуальную информацию об этих белках. В результате модель быстро сгенерировала миллион последовательностей новых белков, и ученые выбрали 100 из них для проверки в лабораторных экспериментах. Они сравнили активность искусственных белков с природным — лизоцимом белка куриного яйца. Подобные лизоцимы содержатся также в слезах, слюне и молоке, и они используются организмом для защиты от бактерий.
Оказалось, что два искусственных белка могли разрушать клеточную стенку бактерий так же эффективно, как и лизоцим из белка куриного яйца. При этом их последовательности были лишь на 18% похожи друг на друга, а на другие белки они были похожи на 90% и 70%. Что интересно, в случае с природными белками иногда достаточно одной мутации, чтобы белок больше не мог выполнять свои функции. Однако в случае с искусственными белками они сохраняли активность даже тогда, когда вплоть до 31,4% последовательности было схоже с другими белками.
Ученых удивило то, что с помощью ИИ им удалось получить искусственные белки правильной структуры. Модель обучалась только с помощью аминокислотных последовательностей, но смогла предсказать структуру для новых белков. С помощью рентгеновской кристаллографии ученые установили атомные структуры искусственных белков и показали, что они схожи с другими лизоцимами.
Ученые отметили эффективность и перспективность их технологии. С помощью нее можно генерировать неограниченное число белков. Например, лизоцимы являются небольшими белками, обычно их последовательность составляет только 300 аминокислот. Всего в белках может быть 20 типов аминокислот, так что для ИИ есть возможность генерации 20300 разных белков. Это число превышает суммарную численность всех людей, когда-либо живших на Земле, помноженную на число песчинок, помноженное на число атомов во Вселенной. Из-за таких безграничных возможностей ProGen ученые считают, что человечество вошло в новую эру инжиниринга белков.