Антитела — небольшие белки, вырабатываемые иммунной системой. Они могут прикрепляться к определенным частям вируса, чтобы нейтрализовать его. Одним из способов победить вирус станет изобретение искусственных антител, которые связываются с шиповидными белками вируса, чтобы предотвратить его проникновение в клетку человека.
Чтобы успешно создать такие антитела, исследователи должны точно понять, как белок «склеится» с вирусом. Белки — комковатые трехмерные структуры, содержащие множество складок. Они могут соединяться в миллионах комбинаций, поэтому для разработки лекарств поиск правильного варианта молекулы белка среди почти бесчисленного количества кандидатов требует чрезвычайно много времени.
Чтобы упростить процесс, исследователи Массачусетского технологического института создали модель для обучения искусственного интеллекта, которая может предсказывать структуру, получающуюся при соединении двух белков. Об этом сообщили в институте.
Новый метод в 80–500 раз быстрее, чем другие программы, и хорошо предсказывает реальные структуры белков.
«Нейросеть очень хорошо фиксирует взаимодействия между различными белками, которые химикам или биологам трудно выделить экспериментально. Некоторые из этих взаимодействий очень сложны. Наша модель глубокого обучения может изучать типы взаимодействий на основе данных», — говорит Октавиан-Юджен Ганеа из Массачусетского технологического института.
Модель под названием Equidock умеет вращать два белка в трехмерном пространстве, не деформируя их. В нее встроена информация, как белки стыкуются в организме человека. Система идентифицирует точки связывания — атомы двух белков, которые с наибольшей вероятностью будут взаимодействовать и образовывать химические реакции.
После обучения модели исследователи сравнили ее с четырьмя уже используемыми программами. Equidock может предсказать конечный белковый комплекс всего за одну-пять секунд, тогда как другие программы работали от 10 минут до часа и более. В показателях, насколько близко предсказанный белковый комплекс соответствует реальному, Equidock был сопоставим с другим софтом, но иногда уступал ему.
«Наш метод можно улучшить, но он уже может быть полезен. Его можно использовать в очень большом виртуальном скрининге, где тысячи белков будут взаимодействовать и образовывать комплексы. А затем наиболее вероятные варианты можно проверить с помощью более точных, но медленных традиционных методов», — говорит Ганеа.
По его словам, их метод также может быть применен для разработки небольших молекул лекарств.
В будущем ученые планируют улучшить Equidock. Самым большим препятствием является нехватка данных для обучения, поэтому Ганеа и его коллеги работают над созданием синтетических данных, которые могли бы использоваться для улучшения модели.
Открытие поможет быстрее создавать лекарства.