Самое большое генеалогическое древо человечества: 27 миллионов предков

Исследователи из Института больших данных Оксфордского университета сделали важный шаг к картированию всех генетических взаимоотношений между людьми: единой генеалогии, которая прослеживает происхождение всех нас. Исследование было опубликовано сегодня в журнале Science.

За последние два десятилетия произошли выдающиеся достижения в области генетических исследований человека, в результате которых были получены геномные данные для сотен тысяч людей, в том числе тысяч доисторических людей. Это открывает захватывающую возможность проследить происхождение генетического разнообразия человека, чтобы составить полную карту того, как люди во всем мире связаны друг с другом.

До сих пор основными проблемами этого видения были разработка способа объединения последовательностей генома из множества различных баз данных и разработка алгоритмов для обработки данных такого размера. Однако новый метод, опубликованный сегодня исследователями из Института больших данных Оксфордского университета, может легко комбинировать данные из нескольких источников и масштабироваться для размещения миллионов последовательностей генома.

Доктор Ян Вонг, эволюционный генетик из Института больших данных и один из основных авторов, объяснил: «Мы построили огромное генеалогическое древо, генеалогию для всего человечества, которая максимально точно моделирует историю, породившую все генетическая изменчивость, которую мы находим у людей сегодня. Эта генеалогия позволяет нам увидеть, как генетическая последовательность каждого человека связана с любой другой во всех точках генома».

Поскольку отдельные области генома наследуются только от одного родителя, матери или отца, происхождение каждой точки генома можно рассматривать как дерево. Набор деревьев, известный как «последовательность деревьев» или «граф наследственной рекомбинации», связывает генетические области во времени с предками, где впервые появились генетические вариации.

Ведущий автор доктор Энтони Уайлдер Уонс, который провел исследование в рамках своей докторской диссертации в Институте больших данных, а в настоящее время является постдокторантом в Институте Броуда Массачусетского технологического института и Гарварда, сказал: «По сути, мы реконструируем геномы наших предков и используя их для формирования обширной сети отношений. Затем мы можем оценить, когда и где жили эти предки. Сила нашего подхода заключается в том, что он делает очень мало предположений об основных данных и может также включать как современные, так и древние образцы ДНК».

Исследование объединило данные о современных и древних геномах человека из восьми различных баз данных и включило в общей сложности 3609 последовательностей отдельных геномов из 215 популяций. Древние геномы включали найденные по всему миру образцы возрастом от 1000 до более 100 000 лет. Алгоритмы предсказывали, где в эволюционных деревьях должны присутствовать общие предки, чтобы объяснить закономерности генетической изменчивости. Получившаяся сеть содержала почти 27 миллионов предков.

После добавления данных о местоположении в эти образцы геномов авторы использовали сеть, чтобы оценить, где жили предсказанные общие предки. Результаты успешно восстановили ключевые события в истории эволюции человека, включая миграцию из Африки.

Хотя генеалогическая карта уже является чрезвычайно богатым ресурсом, исследовательская группа планирует сделать ее еще более полной, продолжая включать генетические данные по мере их появления. Поскольку последовательности деревьев хранят данные очень эффективным способом, набор данных может легко вместить миллионы дополнительных геномов.

Доктор Вонг сказал: «Это исследование закладывает основу для следующего поколения секвенирования ДНК. По мере улучшения качества последовательностей генома из современных и древних образцов ДНК деревья станут еще более точными, и мы в конечном итоге сможем создать единую ДНК». единая карта, которая объясняет происхождение всех генетических вариаций человека, которые мы видим сегодня».

Доктор Вонс добавил: «Хотя в центре внимания этого исследования находятся люди, этот метод действителен для большинства живых существ, от орангутангов до бактерий. вытекающие из нашей общей наследственной истории».