Дорогие коллеги,
на прошлой неделе в Копенгагене прошел курс о публикации наборов данных молекулярных последовательностей в GBIF средствами UNITE и PlutoF (Identifying and publishing HTS/Sanger DNA sequence datasets). Курс по этой теме был организован впервые и позволил участникам познакомиться и освоить на практике эту новую инициативу GBIF. В курсе приняли участие около 30 человек из 10 стран. См. подробнее программу: https://sisu.ut.ee/publish-sequence-datasets
Примерно полгода назад GBIF вступил в новый этап развития, добавив к своей таксономической схеме (GBIF backbone taxonomy) основанные на молекулярных последовательностях условные виды («видовые гипотезы», sequence-based species hypotheses, SH). Первым массивом добавленных в GBIF условных видов послужила информационная система UNITE, интегрирующая последовательности r-ДНК грибов. UNITE поддерживается совместно университетом Тарту, университетом Гетенбурга и рядом других учреждений и объединяет ITS-последовательности международных баз данных (INSD: GenBank, ENA, DDBJ), также как и сиквенсы непосредственно загруженные в UNITE сообществом молекулярных микологов.
Экспорт базы данных UNITE и публикация соответствующего набора данных (Сhecklist dataset) в GBIF, позволили добавить условные виды (SH) в таксономическую схему GBIF. При этом, только 13% списка условных видов набора данных пересекаются с традиционной таксономической схемой, остальные SH представляют новые таксоны, в основном, видового ранга («dark taxa» fungi). См. набор данных по ссылке: PlutoF (2019). UNITE — Unified system for the DNA based fungal species linked to the classification. Version 1.2. Checklist dataset https://doi.org/10.15156/bio/587474 accessed via GBIF.org on 2019-01-22.
Следующим шагом в сторону использования основанной на последовательностях таксономической схемы стала публикация набора данных по метабаркодингу проекта BioWIDE (http://bios.au.dk/om-instituttet/organisation/biodiversitet/projekter/biowide/). В ходе проекта производился отбор проб на 130 площадках в Дании, в том числе отбиралась почва для тотального секвенирования разнообразия грибов. Обработка последовательностей и идентификация видовых гипотез (SH) производилась на платформе UNITE. Полученные данные были опубликованы в виде набора данных (Occurrence dataset), при этом сохранялась и информация о пробных площадях (Sampling events). В отличие от обычного набора данных этого формата, только 30% SHs набора данных соответствовали традиционным таксонам, остальные 70% были привязаны к добавленным в таксономическую систему GBIF условным видам.
См. набор данных по ссылке: Frøslev T, Ejrnæs R (2018). BIOWIDE eDNA Fungi dataset. Danish Biodiversity Information Facility. Occurrence dataset https://doi.org/10.15468/nesbvx accessed via GBIF.org on 2019-01-22.
Подробнее о работе GBIF с условными видами и публикации UNITE и BIOWIDE наборов данных см. в статье и ссылках в ней: Adding sequence-based identifiers to backbone taxonomy reveals ‘dark taxa’ fungi (https://www.gbif.org/news/2LrgV5t3ZuGeU2WIymSEuk/adding-sequence-based-identifiers-to-backbone-taxonomy-reveals-dark-taxa-fungi).
GBIF продолжает работу по интеграции молекулярных данных совеместно c EMBL-EBI и ELIXIR https://www.gbif.org/news/6ewyUhBpRYammYWI2CgsM4/biodiversity-infrastructures-to-crosslink-metagenomics-and-species-occurrence-data и другими источниками молекулярных таксонов и данных метабаркодинга. молекулярных находок
Возвращаясь к прошедшему семинару, он позволил разработчикам UNITE и PlutoF и команде GBIF обучить участников процедуре публикации набора молекулярных данных (вслед за публикацией BioWIDE) с использованием данных участников и продолжить отладку системы. Студенты, со своей стороны, смогли получить первое впечатление о развивающемся проекте и непосредственно пообщаться с командой разработчиков. В результате семинара в классе было опубликовано 4 набора данных, остальные будут опубликованы позже самостоятельно.
Наборы данных молекулярных последовательностей, опубликованные во время курса:
-
Marizzi C. Urban Barcode Project — Fungi. PlutoF. Occurrence dataset https://doi.org/10.15468/ohuui6 accessed via GBIF.org on 2019-01-22.
-
Amiri R, Ilves K. Tartu Botanical Garden leaf and root endophytes. PlutoF. Occurrence dataset https://doi.org/10.15468/lvqc8b accessed via GBIF.org on 2019-01-22.
-
Iršėnaitė R. FUNGID Fungi dataset. PlutoF. Occurrence dataset https://doi.org/10.15468/jlzye0 accessed via GBIF.org on 2019-01-22.
-
Filippova N, Popov E (2019). A new species and one interesting finding from Mukhrino bog, Western Siberia. Version 1.7. Yugra State University Biological Collection (YSU BC). Occurrence dataset https://doi.org/10.15468/g4ynvy accessed via GBIF.org on 2019-01-22.
Таким образом, опубликованные ранее наборы данных и работа во время курса показали, что GBIF готов для публикации данных молекулярных последовательностей. Российские участники также могут публиковать молекулярные данные, воспользовавшись приведенными ссылками и материалами курса.
Публикация молекулярных данных позволит значительно расширить представление о биоразнообразии и его экологических функциях, и это хорошо понимают в GBIF. Формально описанные таксономические виды представляют лишь незначительную долю предполагаемого видового разнообразия на планете, особенно в ряде групп микроорганизмов. Эта инициатива GBIF добавит «света» в это скрытое разнообразие (dark matter) и открывает новые возможности для исследователей, работающих в области метабаркодинга. Так, полученные последовательности больше не будут оставаться «в столах» и на жестких дисках исследователей, а могут быть использованы для коллективного анализа, развития знаний о скрытом разнообразии и в конечном итоге его описания.
спасибо
НравитсяНравится