Машинное обучение создает реалистичные геномы несуществующих людей

Новости

Благодаря новым алгоритмам и достижениям в области компьютерных технологий машины теперь могут изучать сложные модели и даже генерировать высококачественные синтетические данные, такие как фотореалистичные изображения или даже резюме воображаемых людей.

В исследовании, недавно опубликованном в международном журнале PLOS Genetics, машинное обучение используется для майнинга существующих биобанков и создания фрагментов геномов человека, которые не принадлежат реальным людям, но имеют характеристики настоящих геномов.

Многодисциплинарная команда провела несколько анализов, чтобы оценить качество сгенерированных геномов по сравнению с реальными. «Удивительно, но эти геномы, возникающие из случайного шума, имитируют сложности, которые мы можем наблюдать в реальных человеческих популяциях, и по большинству свойств они неотличимы от других геномов из биобанка, который мы использовали для обучения нашего алгоритма, за исключением одной детали: они действительно не принадлежат к какому-либо генному донору », — сказал д-р Лука Пагани, один из ведущих авторов исследования и сотрудник Mobilitas Pluss.

Исследование дополнительно включает оценку близости искусственных геномов к реальным геномам, чтобы проверить, сохраняется ли конфиденциальность исходных образцов. «Хотя обнаружение утечек конфиденциальности среди тысяч геномов может показаться поиском иголки в стоге сена, объединение нескольких статистических показателей позволило нам тщательно проверить все модели. Интересно, что подробное исследование сложных моделей утечки может привести к улучшениям в оценке генеративной модели и «, — сказала доктор Флора Джей, координатор исследования и исследователь CNRS в Междисциплинарной лаборатории информатики (LRI / LISN, Université Paris-Saclay, Французский национальный центр научных исследований).

В общем, подходы к машинному обучению предоставили лица, биографии и множество других особенностей горстке воображаемых людей: теперь мы знаем больше об их биологии. Эти воображаемые люди с реалистичными геномами могут служить заместителями для всех реальных геномов, которые не являются общедоступными или требуют длительных процедур применения или сотрудничества, тем самым устраняя важный барьер доступности в геномных исследованиях, особенно для недостаточно представленных популяций.

Газета «DAILY» — Новости России и мира