В среду 9 октября Нобелевский комитет объявил лауреатов премии этого года по химии. Половину премии получил Дэвид Бейкер (David Baker) из университета Вашингтона «за вычислительное проектирование белков»; вторую половину разделили Демис Хассабис (Demis Hassabis) и Джон Джампер (John M. Jumper) из компании Google DeepMind «за предсказание структуры белка».
Нобелевская премия по химии в 2024 году отмечает исследования структуры белков. Она посвящена двум различным, но связанным между собой открытиям. Дэвид Бейкер смог решить сложнейшую задачу построения новых видов белков. Д.Хассабис и Дж. Джампер разработали модель искусственного интеллекта для решения задачи, над которой химики и биологи работали пятьдесят лет: предсказание сложной структуры белков.
Белки состоят из 20 различных аминокислот — «строительных блоков» жизни. В 2003 году Дэвид Бейкер смог при помощи этих блоков создать новый белок, непохожий на известные к тому времени. С тех пор исследователи создали множество таких новых белков включая вещества, которые можно использовать в фармацевтике, производстве наноматериалов и, например, в качестве микродатчиков.
Сфера проектирования белков («белковый дизайн») начала интенсивно развиваться с конца 1990-х. Чаще всего исследователи занимались модификацией существующих белков. Группа Бейкера пыталась создавать белки «с нуля» (такое направление проектирования называется de novo design, или проектирование из первопринципов). В частности, для определения, какой набор аминокислот может создать белок с заданными свойствами и структурой, использовался программный комплекс Rosetta, разработкой которого занимался Д.Бейкер.
Для поиска нужного набора Rosetta просматривала базу данных всех известных белковых структур и находила короткие фрагменты белков, свойства которых напоминали желаемую структуру нового белка. Затем программа оптимизировала такие фрагменты и предлагала последовательность аминокислот для конструирования нужного белка.
Один из первых удачных полученных таким образом белков под названием Top7 имел практически такую структуру, которую и пытались спроектировать. То есть оказалось, что Rosetta действительно умеет проектировать новые белки. До этого химикам, которые занимались тем самым дизайном ab novo, удавалось только имитировать существующие структуры. Структуры Top7 в природе не существовало. Кроме того, новый белок содержал цепочку из 93 аминокислот и стал самой большой молекулой, полученной по технологии белкового проектирования. Бейкер опубликовал своё открытие в 2003 году. Оно стало первым шагом в этом направлении. На рисунке представлены только несколько из новых белков, которые его лаборатория впоследствии создала из первопринципов.
Второе открытие относится к предсказанию структуры белков. Два десятка известных аминокислот могут сочетаться в молекуле белка разными способами, создавая большое число комбинаций. Используя информацию в ДНК, аминокислоты соединяются вместе, создавая длинные цепочки. Далее, цепочка аминокислот может сворачиваться и переплетаться, формируя уникальную трёхмерную структуру. Именно эта структура определяет функцию белка. С начала 1960-х годов химики поняли, что эта трёхмерная структура должна определяться последовательностью аминокислот в белке: так, в экспериментах тех лет такую трёхмерную ленту белка удавалось «распутать», и после этого белок снова принимал ту же форму. С 1970 годов биологи и химики пытались научиться предсказывать структуры белков исходя из последовательностей аминокислот, которые входят в их состав, и эта задача оказалась невероятно сложной. Четыре года назад удалось сделать существенный рывок в её решении.
В 2020 году Демис Хассабис и Джон Джампер представили модель ИИ под названием AlphaFold2. С её помощью они смогли предсказать структуру практически всех 200 миллионов белков, которые на этот момент были известны биологам.