Новые ресурсы эталонного генома человека помогают фиксировать глобальное генетическое разнообразие

Когда в 2003 году был завершен проект «Геном человека», его визитной карточкой стал эталонный геном человека, набор последовательностей ДНК, который служит структурой и репрезентативным примером полного набора генов человека. Для областей генома, где у разных людей мало различий, эталонный геном является важным ресурсом, который помог продвинуть вперед усилия в области секвенирования генов, исследований ассоциаций на уровне всего генома и характеристики белков.
Поскольку почти все эксперименты по генетическому секвенированию основаны на эталонном геноме человека, существует острая необходимость в улучшении эталона, чтобы лучше отражать разнообразие, обнаруживаемое в различных популяциях людей, – объяснила Карен Вонг, бакалавр наук, аспирантка лаборатории профессора Пуи-Яна Квок в лаборатории профессора Пуи-Яна Квок.

Калифорнийский университет в Сан-Франциско (UCSF), представивший исследование. Более репрезентативная ссылка будет полезна ученым, использующим миллионы существующих наборов данных по секвенированию, а также будущим исследованиям секвенирования.
"Каким бы неотъемлемым элементом ни было научное сообщество, текущий эталонный геном не отражает генетического разнообразия, обнаруженного в различных популяциях человека. Это ограничение, потому что эталонный геном сконструирован из ДНК нескольких человек, и более 70% его последовательностей поступает от одного донора ", – говорит г-жа.

Вонг сказал. При изучении групп, которые могут иметь больше генетических отличий от эталонного генома, эталонный геном менее полезен и может даже внести ошибку или предвзятость в результаты.
В частности, исследователи сталкиваются с проблемой, когда конкретный образец включает в себя последовательности вставки – участки ДНК, которые относительно эталона представляют собой добавление. Длина этих последовательностей вставки может варьироваться от нескольких сотен пар оснований до полной дупликации гена, но, поскольку они не существуют в эталонном геноме, они не могут быть сопоставлены с эталоном и поэтому не имеют необходимого контекста для надлежащего изучения.

По этой причине от таких последовательностей часто отказываются.
«Смысл последовательности основан на знании того, откуда она взялась», – сказала г-жа.

Вонг сказал. "Знание места расположения последовательности в геноме позволяет исследователям интерпретировать вставки на основе окружающих их последовательностей."
Для достижения этой цели г-жа. Вонг и его коллеги из UCSF и Института биомедицинских наук в Academia Sinica на Тайване полностью секвенировали более 300 геномов со всего мира, позаботившись о включении как мужских, так и женских последовательностей из различных субпопуляций. Сосредоточившись на областях геномов, которые не были сопоставлены с эталонным геномом, они использовали процесс, называемый сборкой de novo, для идентификации новых уникальных последовательностей вставки и их местоположения относительно эталона.

Они смогли разместить подавляющее большинство уникальных последовательностей, отсутствующих в эталоне, что позволило им добавить детали в эталонный геном, улучшив их и других исследователей способность отображать будущие последовательности и изучать их в контексте.
В качестве следующих шагов г-жа. Вонг и его коллеги планируют продолжить секвенирование различных глобальных геномов, а также изучить, как лучше всего увеличить и организовать референсный геном, чтобы сделать его наиболее полезным для исследователей.

«Геном человека имеет множество сложных участков, которые не может полностью описать ни одна эталонная структура», – сказала г-жа. Вонг сказал. "Важно продумать, какая информация должна быть представлена ​​в эталонном геноме человека, а какая не должна быть включена, чтобы убедиться, что она полезна для различных целей, но позволяет избежать чрезмерной сложности.

Ссылка: K Wong et al. (16 октября 2019 г.). Резюме: Создание эталонного генома, отражающего глобальное генетическое разнообразие, для улучшенной интерпретации данных секвенирования всего генома.

Представлено на ежегодном собрании Американского общества генетики человека в 2019 г. Хьюстон, Техас.