Революционная методика позволяет исследователям заглянуть в механизмы работы клеток и открывает новые горизонты для изучения рака, генетических заболеваний и других биологических процессов.
Ученые из Колумбийского университета создали принципиально новую модель искусственного интеллекта, которая способна понимать «язык» клеток и предсказывать их активность. Разработка использует принципы, сходные с теми, которые лежат в основе известных языковых моделей, таких как ChatGPT. Однако вместо обработки человеческого языка система анализирует данные о клеточной активности, включая информацию о генах и экспрессии генома. В результате ученые могут предсказать, какие гены активны в определенной клетке, и, следовательно, понять ее функции и поведение.
По словам Рауля Рабадана, профессора системной биологии и старшего автора исследования, такие модели способны значительно ускорить и упростить изучение биологических процессов. «Традиционные методы хорошо подходят для описания клеточных реакций, но они не могут предсказывать поведение клеток или их реакцию на изменения, такие как мутации, вызывающие рак,» — говорит он. «Наша модель меняет подход, превращая биологию из науки описания в науку предсказания.»
В последние годы накопление огромных объемов данных и совершенствование ИИ делают биологию более предсказуемой. Однако, несмотря на успехи в моделировании, например, структур белков, предсказание активности генов внутри клеток оставалось сложной задачей. Рабадан и его команда решили изменить подход, обучив модель на данных из более чем 1,3 миллиона клеток из тканей здоровых людей. Вместо того чтобы ограничиваться узкоспециализированными клеточными типами, например, раковыми клетками, модель использовала широкий спектр данных, что сделало ее универсальной.