Новая платформа Metascape позволяет биологам открывать новые возможности для анализа больших данных

Теперь ученые из Sanford Burnham Prebys, Института геномики Исследовательского фонда Novartis (GNF) и Калифорнийского университета в Сан-Диего открыли веб-портал с открытым доступом, который объединяет более 40 передовых источников данных биоинформатики, что позволяет не -технические пользователи, чтобы генерировать идеи в один клик. Этот инструмент, получивший название Metascape, устраняет барьеры для анализа данных, позволяя исследователям тратить больше времени на важные биологические вопросы и меньше времени на создание и устранение неполадок рабочего процесса анализа данных. Платформа была описана сегодня в Nature Communications.

«Биологи ищут ответы на некоторые из самых разрушительных болезней сегодняшнего дня – от рака до болезни Альцгеймера и инфекционных заболеваний, таких как ВИЧ или грипп (грипп)», – говорит Сумит Чанда, доктор философии.D., старший автор исследования и директор программы иммунитета и патогенеза в Sanford Burnham Prebys. «Разрабатывая Metascape, мы надеемся помочь биологам лучше понять свои собственные данные, чтобы они могли получить информацию, которая приведет к новым целям болезней, улучшенным вакцинам и новым лекарствам для лечения сложных заболеваний."
Добавляет Инъяо Чжоу, Ph.D., первый автор исследования и директор по науке о данных и инженерии данных в GNF: «Даже для ученых-вычислителей компиляция и анализ больших наборов данных OMIC может быть сложной и трудоемкой задачей.

Metascape предоставляет биологам платформу, с которой они могут получить доступ к многочисленным инструментам анализа в простом интерфейсе и создать легко интерпретируемый отчет."
В статье исследователи подробно описывают особенности и возможности Metascape, используя три ранее опубликованных генетических скрининга гриппа, целью которых было выявить факторы, участвующие в репликации вируса. В своем рабочем процессе Metascape интегрирует и анализирует информацию из более чем 40 популярных баз данных с открытым доступом, охватывающих 10 распространенных модельных организмов, для создания легко интерпретируемого отчета примерно за минуту (для больших наборов данных может потребоваться больше времени).
«Metascape уже облегчил анализ и интерпретацию больших наборов данных OMIC в более чем 330 опубликованных научных исследованиях.

Мы ожидаем, что благодаря простоте использования он вскоре станет незаменимой платформой, которая поможет ученым расшифровать важные результаты в эпоху больших данных », – добавляет Ларс Паш, доктор философии.D., автор исследования и доцент-исследователь в Sanford Burnham Prebys.
Варианты базового анализа, в котором используются общепринятые методы анализа; или расширенный анализ, позволяющий контролировать индивидуальные настройки. Презентация PowerPoint, документ Excel и дополнительные инструменты визуальной отчетности были созданы автоматически, что облегчило передачу результатов.

Чтобы данные Metascape оставались как можно более актуальными, исследователи использовали двухэтапный подход, в котором используется робот, который автоматически сканирует источники данных с последующим ручным контролем качества.
Затем ученые обращаются к искусственному интеллекту, чтобы углубить понимание, которое может предоставить Metascape. «Применяя новые инструменты машинного обучения к Metascape, мы можем помочь биологам раскрыть больше нюансов в своих данных, которые помогут ученым еще лучше определить направление, в котором они хотят проводить свои исследования», – говорит Чжоу.