Пост-релиз о курсе по публикации молекулярных данных

Дорогие коллеги,

на прошлой неделе в Копенгагене прошел курс о публикации наборов данных молекулярных последовательностей в GBIF средствами UNITE и PlutoF (Identifying and publishing HTS/Sanger DNA sequence datasets).  Курс по этой теме был организован впервые и позволил участникам познакомиться и освоить на практике эту новую инициативу GBIF. В курсе приняли участие около 30 человек из 10 стран. См. подробнее программу: https://sisu.ut.ee/publish-sequence-datasets

Примерно полгода назад GBIF вступил в новый этап развития, добавив к своей таксономической схеме (GBIF backbone taxonomy) основанные на молекулярных последовательностях условные виды («видовые гипотезы», sequence-based species hypotheses, SH).  Первым массивом добавленных в GBIF условных видов послужила информационная система UNITE, интегрирующая последовательности r-ДНК грибов. UNITE поддерживается совместно университетом Тарту, университетом Гетенбурга и рядом других учреждений и объединяет ITS-последовательности международных баз данных (INSD: GenBank, ENA, DDBJ), также как и сиквенсы непосредственно загруженные в UNITE сообществом молекулярных микологов.

Экспорт базы данных UNITE и публикация соответствующего набора данных (Сhecklist dataset) в GBIF, позволили добавить условные виды (SH) в таксономическую схему GBIF. При этом, только 13% списка условных видов набора данных пересекаются с традиционной таксономической схемой, остальные SH представляют новые таксоны, в основном, видового ранга («dark taxa» fungi). См. набор данных по ссылке: PlutoF (2019). UNITE — Unified system for the DNA based fungal species linked to the classification. Version 1.2. Checklist dataset https://doi.org/10.15156/bio/587474 accessed via GBIF.org on 2019-01-22.

Следующим шагом в сторону использования основанной на последовательностях таксономической схемы стала публикация набора данных по метабаркодингу проекта BioWIDE (http://bios.au.dk/om-instituttet/organisation/biodiversitet/projekter/biowide/). В ходе проекта производился отбор проб на 130 площадках в Дании, в том числе отбиралась почва для тотального секвенирования  разнообразия грибов. Обработка последовательностей и идентификация видовых гипотез (SH) производилась на платформе UNITE. Полученные данные были опубликованы в виде набора данных (Occurrence dataset), при этом сохранялась и информация о пробных площадях (Sampling events). В отличие от обычного набора данных этого формата, только 30% SHs набора данных соответствовали традиционным таксонам, остальные 70% были привязаны к добавленным в таксономическую систему GBIF условным видам.

См. набор данных по ссылке: Frøslev T, Ejrnæs R (2018). BIOWIDE eDNA Fungi dataset. Danish Biodiversity Information Facility. Occurrence dataset https://doi.org/10.15468/nesbvx accessed via GBIF.org on 2019-01-22.

Подробнее о работе GBIF с условными видами и публикации UNITE и BIOWIDE наборов данных см. в статье и ссылках в ней: Adding sequence-based identifiers to backbone taxonomy reveals ‘dark taxa’ fungi (https://www.gbif.org/news/2LrgV5t3ZuGeU2WIymSEuk/adding-sequence-based-identifiers-to-backbone-taxonomy-reveals-dark-taxa-fungi).

GBIF продолжает работу по интеграции молекулярных данных совеместно c EMBL-EBI и ELIXIR https://www.gbif.org/news/6ewyUhBpRYammYWI2CgsM4/biodiversity-infrastructures-to-crosslink-metagenomics-and-species-occurrence-data и другими источниками молекулярных таксонов и данных метабаркодинга. молекулярных находок

Возвращаясь к прошедшему семинару, он позволил разработчикам UNITE и PlutoF и команде GBIF обучить участников процедуре публикации набора молекулярных данных (вслед за публикацией BioWIDE) с использованием данных участников и продолжить отладку системы. Студенты, со своей стороны, смогли получить первое впечатление о развивающемся проекте  и непосредственно пообщаться с командой разработчиков. В результате семинара в классе было опубликовано 4 набора данных, остальные будут опубликованы позже самостоятельно.

Наборы данных молекулярных последовательностей, опубликованные во время курса:

  • Marizzi C. Urban Barcode Project — Fungi. PlutoF. Occurrence dataset https://doi.org/10.15468/ohuui6 accessed via GBIF.org on 2019-01-22.

  • Amiri R, Ilves K. Tartu Botanical Garden leaf and root endophytes. PlutoF. Occurrence dataset https://doi.org/10.15468/lvqc8b accessed via GBIF.org on 2019-01-22.

  • Iršėnaitė R. FUNGID Fungi dataset. PlutoF. Occurrence dataset https://doi.org/10.15468/jlzye0 accessed via GBIF.org on 2019-01-22.

  • Filippova N, Popov E (2019). A new species and one interesting finding from Mukhrino bog, Western Siberia. Version 1.7. Yugra State University Biological Collection (YSU BC). Occurrence dataset https://doi.org/10.15468/g4ynvy accessed via GBIF.org on 2019-01-22.

Таким образом, опубликованные ранее наборы данных и работа во время курса показали, что GBIF готов для публикации данных молекулярных последовательностей. Российские участники также могут публиковать молекулярные данные, воспользовавшись приведенными ссылками и материалами курса.

Публикация молекулярных данных позволит значительно расширить представление о биоразнообразии и его экологических функциях, и это хорошо понимают в GBIF. Формально описанные таксономические виды представляют лишь незначительную долю предполагаемого видового разнообразия на планете, особенно в ряде групп микроорганизмов. Эта инициатива GBIF добавит «света» в это скрытое разнообразие (dark matter) и открывает новые возможности для исследователей, работающих в области метабаркодинга. Так, полученные последовательности больше не будут оставаться «в столах» и на жестких дисках исследователей, а могут быть использованы для коллективного анализа, развития знаний о скрытом разнообразии и в конечном итоге его описания.

Пост-релиз о курсе по публикации молекулярных данных: Один комментарий

  1. улитка на склоне 26.01.2019 — 23:48

    спасибо

    Нравится

Добавить комментарий

Заполните поля или щелкните по значку, чтобы оставить свой комментарий:

Логотип WordPress.com

Для комментария используется ваша учётная запись WordPress.com. Выход /  Изменить )

Google photo

Для комментария используется ваша учётная запись Google. Выход /  Изменить )

Фотография Twitter

Для комментария используется ваша учётная запись Twitter. Выход /  Изменить )

Фотография Facebook

Для комментария используется ваша учётная запись Facebook. Выход /  Изменить )

Connecting to %s

%d такие блоггеры, как:
search previous next tag category expand menu location phone mail time cart zoom edit close