Пост-релиз о курсе по публикации молекулярных данных

Дорогие коллеги,

на прошлой неделе в Копенгагене прошел курс о публикации наборов данных молекулярных последовательностей в GBIF средствами UNITE и PlutoF (Identifying and publishing HTS/Sanger DNA sequence datasets).  Курс по этой теме был организован впервые и позволил участникам познакомиться и освоить на практике эту новую инициативу GBIF. В курсе приняли участие около 30 человек из 10 стран. См. подробнее программу: https://sisu.ut.ee/publish-sequence-datasets

Примерно полгода назад GBIF вступил в новый этап развития, добавив к своей таксономической схеме (GBIF backbone taxonomy) основанные на молекулярных последовательностях условные виды («видовые гипотезы», sequence-based species hypotheses, SH).  Первым массивом добавленных в GBIF условных видов послужила информационная система UNITE, интегрирующая последовательности r-ДНК грибов. UNITE поддерживается совместно университетом Тарту, университетом Гетенбурга и рядом других учреждений и объединяет ITS-последовательности международных баз данных (INSD: GenBank, ENA, DDBJ), также как и сиквенсы непосредственно загруженные в UNITE сообществом молекулярных микологов.

Экспорт базы данных UNITE и публикация соответствующего набора данных (Сhecklist dataset) в GBIF, позволили добавить условные виды (SH) в таксономическую схему GBIF. При этом, только 13% списка условных видов набора данных пересекаются с традиционной таксономической схемой, остальные SH представляют новые таксоны, в основном, видового ранга («dark taxa» fungi). См. набор данных по ссылке: PlutoF (2019). UNITE — Unified system for the DNA based fungal species linked to the classification. Version 1.2. Checklist dataset https://doi.org/10.15156/bio/587474 accessed via GBIF.org on 2019-01-22.

Следующим шагом в сторону использования основанной на последовательностях таксономической схемы стала публикация набора данных по метабаркодингу проекта BioWIDE (http://bios.au.dk/om-instituttet/organisation/biodiversitet/projekter/biowide/). В ходе проекта производился отбор проб на 130 площадках в Дании, в том числе отбиралась почва для тотального секвенирования  разнообразия грибов. Обработка последовательностей и идентификация видовых гипотез (SH) производилась на платформе UNITE. Полученные данные были опубликованы в виде набора данных (Occurrence dataset), при этом сохранялась и информация о пробных площадях (Sampling events). В отличие от обычного набора данных этого формата, только 30% SHs набора данных соответствовали традиционным таксонам, остальные 70% были привязаны к добавленным в таксономическую систему GBIF условным видам.

См. набор данных по ссылке: Frøslev T, Ejrnæs R (2018). BIOWIDE eDNA Fungi dataset. Danish Biodiversity Information Facility. Occurrence dataset https://doi.org/10.15468/nesbvx accessed via GBIF.org on 2019-01-22.

Подробнее о работе GBIF с условными видами и публикации UNITE и BIOWIDE наборов данных см. в статье и ссылках в ней: Adding sequence-based identifiers to backbone taxonomy reveals ‘dark taxa’ fungi (https://www.gbif.org/news/2LrgV5t3ZuGeU2WIymSEuk/adding-sequence-based-identifiers-to-backbone-taxonomy-reveals-dark-taxa-fungi).

GBIF продолжает работу по интеграции молекулярных данных совеместно c EMBL-EBI и ELIXIR https://www.gbif.org/news/6ewyUhBpRYammYWI2CgsM4/biodiversity-infrastructures-to-crosslink-metagenomics-and-species-occurrence-data и другими источниками молекулярных таксонов и данных метабаркодинга. молекулярных находок

Возвращаясь к прошедшему семинару, он позволил разработчикам UNITE и PlutoF и команде GBIF обучить участников процедуре публикации набора молекулярных данных (вслед за публикацией BioWIDE) с использованием данных участников и продолжить отладку системы. Студенты, со своей стороны, смогли получить первое впечатление о развивающемся проекте  и непосредственно пообщаться с командой разработчиков. В результате семинара в классе было опубликовано 4 набора данных, остальные будут опубликованы позже самостоятельно.

Наборы данных молекулярных последовательностей, опубликованные во время курса:

  • Marizzi C. Urban Barcode Project — Fungi. PlutoF. Occurrence dataset https://doi.org/10.15468/ohuui6 accessed via GBIF.org on 2019-01-22.

  • Amiri R, Ilves K. Tartu Botanical Garden leaf and root endophytes. PlutoF. Occurrence dataset https://doi.org/10.15468/lvqc8b accessed via GBIF.org on 2019-01-22.

  • Iršėnaitė R. FUNGID Fungi dataset. PlutoF. Occurrence dataset https://doi.org/10.15468/jlzye0 accessed via GBIF.org on 2019-01-22.

  • Filippova N, Popov E (2019). A new species and one interesting finding from Mukhrino bog, Western Siberia. Version 1.7. Yugra State University Biological Collection (YSU BC). Occurrence dataset https://doi.org/10.15468/g4ynvy accessed via GBIF.org on 2019-01-22.

Таким образом, опубликованные ранее наборы данных и работа во время курса показали, что GBIF готов для публикации данных молекулярных последовательностей. Российские участники также могут публиковать молекулярные данные, воспользовавшись приведенными ссылками и материалами курса.

Публикация молекулярных данных позволит значительно расширить представление о биоразнообразии и его экологических функциях, и это хорошо понимают в GBIF. Формально описанные таксономические виды представляют лишь незначительную долю предполагаемого видового разнообразия на планете, особенно в ряде групп микроорганизмов. Эта инициатива GBIF добавит «света» в это скрытое разнообразие (dark matter) и открывает новые возможности для исследователей, работающих в области метабаркодинга. Так, полученные последовательности больше не будут оставаться «в столах» и на жестких дисках исследователей, а могут быть использованы для коллективного анализа, развития знаний о скрытом разнообразии и в конечном итоге его описания.

Пост-релиз о курсе по публикации молекулярных данных: 1 комментарий

  1. Аватар улитка на склоне
    улитка на склоне 26.01.2019 — 23:48

    спасибо

    Нравится

Ответить на улитка на склоне Отменить ответ

Создайте подобный сайт на WordPress.com
Начало работы
search previous next tag category expand menu location phone mail time cart zoom edit close