Генетические штрих-коды – это участки вариабельной ДНК, которые можно использовать для идентификации вида путем сравнения его уникальной последовательности штрих-кода с базой данных известных последовательностей тысяч растений. Последние достижения в области высокопроизводительного секвенирования ДНК означают, что теперь можно одновременно различать и анализировать несколько видов в смешанном образце. Этот процесс, метабаркодирование ДНК, избавляет исследователей от кропотливой задачи разделения различных видов растений перед секвенированием их ДНК.
Описано в новой статье, опубликованной в журнале Applications in Plant Sciences, Dr. Карен Белл и ее коллеги из Департамента наук об окружающей среде Университета Эмори использовали общедоступные данные для разработки библиотеки последовательностей гена rbcL, популярного штрих-кода у растений, для использования в исследованиях по метабаркодированию ДНК.
Работа Белла основана на разработке первой базы данных метабаркода ДНК для растений, содержащей последовательности штрих-кода ITS2 более чем 72000 видов. Объединив информацию ITS2 и rbcL, команда смогла точно идентифицировать больше видов из смешанного образца пыльцевых зерен, улучшив разрешение и точность метода метабаркодирования ДНК.
Ген rbcL является полезным штрих-кодом, поскольку он кодирует часть ключевого фермента фотосинтеза рибулозобифосфаткарбоксилазы (RuBisCo), поэтому он присутствует практически во всех видах растений. Один участок его последовательности ДНК сильно различается в зависимости от вида, что делает его идеальным для штрих-кодирования ДНК. За последнее десятилетие на заводах было разработано несколько областей штрих-кодирования, но rbcL особенно подходит для новых технологий.
Белл уточняет: «Мы выбрали rbcL, потому что длина гена легко применима к современным высокопроизводительным методам секвенирования.«Новая библиотека rbcL содержит последовательности из более чем 38 400 видов растений, около 9% всех семенных растений на Земле.
Быстрые инновации в высокопроизводительном секвенировании ДНК оставили позади методы анализа данных, но развитие баз данных rbcL и ITS2 означает, что метабаркодирование ДНК может использоваться для более быстрой и точной идентификации растений, чем когда-либо прежде. Используя комбинированные метабаркоды rbcL и ITS2, Белл и ее команда смогли идентифицировать восемь из девяти видов растений в смеси пыльцевых зерен – больше, чем можно было бы идентифицировать с помощью штрих-кодов rbcL или ITS2 по отдельности. Если вид не включен в справочную библиотеку, он не может быть идентифицирован с помощью штрих-кодирования ДНК, поэтому необходимо добавить больше последовательностей из примерно 450 000 видов цветковых растений, чтобы сделать эти базы данных более полными.
Белл и ее коллеги доработали конвейер биоинформатики для метабаркодирования ДНК, чтобы он мог использовать дополнительные штрих-коды ДНК после разработки их баз данных. Это должно еще больше повысить точность штрих-кодирования, потому что, как объясняет Белл, «чем больше доступно генетических маркеров, тем больше вероятность генетической идентификации.«Поскольку стоимость секвенирования генома снижается, исследователи также не будут ограничены сканированием штрих-кодов небольших фрагментов ДНК:« В какой-то момент в будущем мы будем выполнять штрих-кодирование ДНК с использованием геномов целых растений. Лабораторная технология доступна, но в настоящее время у нас недостаточно полных геномов растений для создания баз данных."
