Стандартизация анализа данных о COVID-19 для содействия международным исследованиям

Общедоступный, бесплатный ресурс (https: // covid.crg.eu) может использоваться исследователями со всего мира для изучения того, как различные разновидности вируса растут, видоизменяются и производят белки.
"Ученые круглосуточно работают над изучением SARS-CoV-2, вируса, вызывающего COVID-19, чтобы мы могли найти его слабые места и победить его. По всему миру публикуется огромное количество научных данных, – говорит Ева Новоа, исследователь из CRG в Барселоне.
«Однако некоторые из технологий, которые мы используем для изучения SARS-CoV-2, такие как секвенирование РНК нанопор, настолько новы, что результаты одного документа не сопоставимы с другим из-за лоскутного одеяния различных стандартов и используемых методологий.

Мы берем все эти данные и анализируем их, чтобы они соответствовали более универсально сопоставимому стандарту. Это поможет исследователям быстрее и точнее определять сильные и слабые стороны коронавируса."
Чтобы понять, как коронавирус растет, мутирует и реплицируется, ученые должны секвенировать РНК COVID-19.

Последовательность РНК раскрывает важную информацию о белках, которые вирус создает для проникновения в человеческие клетки и репликации, что, в свою очередь, информирует правительства об инфекционности и серьезности пандемии.
Для получения результатов с помощью традиционных инструментов секвенирования может потребоваться много времени. В последние годы данные секвенирования в режиме реального времени стали реальностью благодаря использованию технологий секвенирования нанопор, революционизирующим исследования в области геномики и мониторинг вспышек заболеваний. Секвенирование нанопор предоставляет ученым и клиницистам немедленный доступ к информации о последовательностях ДНК и РНК любой живой клетки в режиме реального времени, что позволяет быстро отреагировать на угрозу пандемии.

Однако исходные данные, полученные с помощью секвенирования нанопор, очень сложны. Ученым и клиницистам в настоящее время не хватает систематических руководств по воспроизводимому анализу данных, что ограничивает огромный потенциал зарождающейся технологии.
Чтобы стандартизировать анализ общедоступных данных секвенирования нанопор SARS-CoV-2, исследователи из Центра геномной регуляции (CRG) в Барселоне используют MasterOfPores, компьютерную программу, разработанную группой Евы Новоа и CRG Bioinformatics Unit. Программное обеспечение было впервые описано на прошлой неделе в Frontiers in Genetics.

"Интернет и растущая культура открытой науки, обмена данными и препринтов изменили исследовательский ландшафт. Инфраструктура, на создание которой ушли бы месяцы для исследования появляющегося вируса, теперь может быть создана всего за несколько дней благодаря новым научным вычислительным подходам », – говорит Юлия Пономаренко, руководитель отдела биоинформатики CRG.
MasterOfPores может быть запущен на любой Unix-совместимой ОС на компьютере, в кластере или в облаке без необходимости установки какого-либо дополнительного программного обеспечения или зависимостей и находится в свободном доступе на Github.

На общедоступном, бесплатном ресурсе в настоящее время проанализировано 3 ТБ данных секвенирования нанопор РНК SARS-CoV-2. Исследователи CRG продолжат пополнять ресурс новыми данными, как только они станут доступны.