Названный Alvis, новый инструмент визуализации исследует сопоставления между данными последовательностей ДНК и базами данных эталонного генома. Это позволяет специалистам по биоинформатике более легко анализировать свои данные, полученные из общих задач и форматов геномики, путем создания эффективных готовых векторных изображений.
Первый автор и доктор наук в Институте Эрлхэма доктор Сэмюэл Мартин из Leggett Group сказал: «Как правило, инструменты выравнивания выводят простые текстовые файлы, содержащие списки данных выравнивания. Это отлично подходит для компьютерного синтаксического анализа и для включения в конвейер, но может быть трудно интерпретировать людям.
«Визуализация данных центровки может помочь нам понять проблему.
В качестве новой технологии было реализовано несколько новых форматов выравнивания с помощью новых инструментов, специфичных для технологии секвенирования нанопор.
«Мы обнаружили, что существующие инструменты визуализации не могут интерпретировать эти форматы; Alvis может использоваться со всеми распространенными форматами выравнивания и легко расширяется для будущих."
Ключевой особенностью нового инструмента командной строки является его уникальная способность автоматически выделять химерные последовательности – слабые звенья в цепочке ДНК. Здесь две последовательности – из разных частей генома или разных видов – по ошибке связаны друг с другом, чтобы образовать одну, что влияет на точность данных.
Последовательности химеры могут быть проблематичными для биоинформатиков при идентификации конкретной ДНК. Формирование химеры может физически происходить с молекулами ДНК во время подготовки библиотеки секвенирования, во время процесса секвенирования на некоторых платформах или с помощью инструментов сборки при попытке собрать вместе геном.
Во время разработки инструмента команда сравнивала сборки генома с использованием и без использования обнаружения химер Алвиса.
Созданное векторное изображение показывает пример выходных данных, где интуитивно понятный инструмент отслеживает все чтения, которые он распознает как химеры.
«Хотя химерные последовательности не составляют большую часть образцов, они могут иметь значительный эффект, поэтому мы должны быть осторожны, чтобы идентифицировать их во время анализа», – сказал д-р Мартин.
"В примере диаграммы Алвиса данных химеры каждый прямоугольник на странице представляет чтение, а цветные блоки внутри них представляют выравнивания.
Большинство химер легко увидеть, потому что их выравнивания имеют разные цвета, что означает, что они соответствуют разным геномам. Другие более тонкие, потому что оба выравнивания относятся к одному и тому же геному, но к разным регионам."
Инструмент Alvis может точно определить визуализацию только химерных последовательностей для дальнейшего изучения и вывести числовые данные, описывающие химеры.
Это демонстрирует, что при применении инструмента и последующем биоинформатическом разделении химер качество сборок значительно улучшается.
Доктор Мартин добавил: «Мы надеемся, что Алвис по-прежнему будет полезен другим исследователям, работающим, например, с секвенированием нанопор; они улучшают понимание своих данных с помощью визуализации. выравнивания ”.
«Выравнивания настолько важны для биоинформатики, что они могут быть полезны любому, кто работает с данными секвенирования при длительном считывании, а также выравниваниями, созданными путем секвенирования данных с платформ для короткого считывания. Диаграммы, которые генерирует Алвис, можно легко экспортировать для непосредственного использования в публикациях, что уже продемонстрировано в нашем исследовании."
