Оперативная таксономическая единица
Операционная таксономическая единица ( OTU ) — это рабочее определение, используемое для классификации групп близкородственных особей. Этот термин был первоначально введен в 1963 году Робертом Р. Сокалом и Питером Х.А. Снитом в контексте числовой таксономии , где «оперативная таксономическая единица» — это просто группа организмов, изучаемых в настоящее время. [1] Численная таксономия — это метод биологической систематики, который включает использование числовых методов для классификации таксономических единиц на основе состояния их характеристик. [2] В этом смысле OTU — это прагматическое определение группировки особей по сходству, эквивалентное, но не обязательно соответствующее классической таксономии Линнея или современной эволюционной таксономии .
OTU используются в исследованиях секвенирования ДНК микробных сообществ для определения различий между организмами на видовом уровне и представляют собой наиболее часто используемую единицу измерения микробного разнообразия. [3] В настоящее время, однако, термин «OTU» обычно используется в другом контексте и относится к кластерам (некультивируемых или неизвестных) организмов, сгруппированных по сходству последовательностей ДНК определенного таксономического маркерного гена (первоначально называемого mOTU; молекулярный OTU). [4] Другими словами, OTU являются прагматическими представителями « видов » (микробных или многоклеточных ) на разных таксономических уровнях в отсутствие традиционных систем биологической классификации , доступных для макроскопических организмов. В течение нескольких лет OTU были наиболее часто используемыми единицами разнообразия, особенно при анализе малых субъединиц 16S (для прокариот) или 18S рРНК (для эукариот). [5] ) наборы данных последовательностей маркерных генов.
Последовательности могут быть сгруппированы в соответствии с их сходством друг с другом, а операционные таксономические единицы определяются на основе порога сходства (обычно сходство 97%; однако часто встречается и 100% сходство, также известное как одиночные варианты). [6] ), установленный исследователем. Остается спорным, насколько хорошо этот широко используемый метод воспроизводит истинную филогению или экологию видов микробов. Хотя OTU можно рассчитывать по-разному при использовании разных алгоритмов или порогов, исследования Schmidt et al. (2014) продемонстрировали, что микробные OTU в целом были экологически согласованы в разных средах обитания и в нескольких подходах к кластеризации OTU. [7] Количество определенных OTU может быть завышено из-за ошибок в секвенировании ДНК. [8]
Подходы к кластеризации OTU
[ редактировать ]Существует три основных подхода к кластеризации OTU: [9]
- De novo , для которого кластеризация основана на сходстве между чтениями секвенирования.
- Закрытая ссылка, для которой кластеризация выполняется по эталонной базе данных последовательностей.
- Открытая ссылка, при которой кластеризация сначала выполняется на основе эталонной базы данных последовательностей, а затем любые оставшиеся последовательности, которые не могут быть сопоставлены со ссылкой, кластеризуются заново .
Алгоритмы кластеризации OTU
[ редактировать ]- Алгоритмы иерархической кластеризации (HCA): ucust [10] и CD-хит [11] И ЭСПРИТ [12]
- Байесовская кластеризация : CROP [13]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Сокал и Снит: Принципы числовой таксономии , Сан-Франциско: WH Freeman, 1957.
- ^ «Соавторы» , Arc.Ask3.Ru и академические библиотеки , Michigan Publishing, 15 сентября 2021 г. , получено 17 января 2024 г.
- ^ Эскалас, Артур; Хейл, Лорен; Вордекерс, Джеймс В.; Ян, Юньфэн; Файерстоун, Мэри К.; Альварес-Коэн, Лиза; Чжоу, Цзичжун (октябрь 2019 г.). «Микробное функциональное разнообразие: от концепций к приложениям» . Экология и эволюция . 9 (20): 12000–12016. дои : 10.1002/ece3.5670 . ISSN 2045-7758 . ПМК 6822047 . ПМИД 31695904 .
- ^ Блакстер, М.; Манн, Дж.; Чепмен, Т.; Томас, Ф.; Уиттон, К.; Флойд, Р.; Абебе, Э. (октябрь 2005 г.). «Определение оперативных таксономических единиц с использованием данных штрих-кода ДНК» . Philos Trans R Soc Lond B Biol Sci . 360 (1462): 1935–43. дои : 10.1098/rstb.2005.1725 . ПМК 1609233 . ПМИД 16214751 .
- ^ Соммер, Стефани А.; Вауденберг, Лорен Ван; Ленц, Петра Х.; Сепеда, Джорджина; Гетце, Эрика (2017). «Вертикальные градиенты видового богатства и состава сообществ в сумеречной зоне субтропического круговорота северной части Тихого океана» . Молекулярная экология . 26 (21): 6136–6156. дои : 10.1111/mec.14286 . hdl : 11336/53966 . ISSN 1365-294X . ПМИД 28792641 .
- ^ Портер, Тересита М.; Хаджибабаи, Мехрдад (2018). «Расширение масштабов: руководство по высокопроизводительным геномным подходам к анализу биоразнообразия» . Молекулярная экология . 27 (2): 313–338. дои : 10.1111/mec.14478 . ISSN 1365-294X . ПМИД 29292539 .
- ^ Шмидт, Томас С.Б.; Родригеш, Жоау Ф. Матиас; фон Меринг, Кристиан (24 апреля 2014 г.). «Экологическая согласованность операционных таксономических единиц СГУ на основе рРНК в глобальном масштабе» . ПЛОС Компьютерная Биол . 10 (4): e1003594. Бибкод : 2014PLSCB..10E3594S . дои : 10.1371/journal.pcbi.1003594 . ISSN 1553-7358 . ПМЦ 3998914 . ПМИД 24763141 .
- ^ Кунин В.; Энгельбректсон, А.; Охман, Х.; Гугенгольц, П. (январь 2010 г.). «Морщины в редкой биосфере: ошибки пиросеквенирования могут привести к искусственному завышению оценок разнообразия» . Энвайрон Микробиол . 12 (1): 118–23. дои : 10.1111/j.1462-2920.2009.02051.x . ПМИД 19725865 .
- ^ Копылова Е., Навас-Молина Дж.А., Мерсье С., Сюй З.З., Маэ Ф., Хе Ю. и др. (23 февраля 2016 г.). Сегата Н (ред.). «Методы кластеризации последовательностей с открытым исходным кодом улучшают современное состояние» . mSystems . 1 (1): e00003–15. дои : 10.1128/mSystems.00003-15 . ПМК 5069751 . ПМИД 27822515 .
- ^ Эдгар, Роберт К. (1 октября 2010 г.). «Поиск и кластеризация на порядки быстрее, чем BLAST» . Биоинформатика . 26 (19): 2460–2461. doi : 10.1093/биоинформатика/btq461 . ISSN 1367-4803 . ПМИД 20709691 .
- ^ Фу, Лимин; Ню, Бэйфан; Чжу, Чжэнвэй; Ву, Ситао; Ли, Вэйчжун (1 декабря 2012 г.). «CD-HIT: ускорение для кластеризации данных секвенирования следующего поколения» . Биоинформатика . 28 (23): 3150–3152. doi : 10.1093/биоинформатика/bts565 . ISSN 1367-4803 . ПМК 3516142 . ПМИД 23060610 .
- ^ Фу, Лимин; Ню, Бэйфан; Чжу, Чжэнвэй; Ву, Ситао; Ли, Вэйчжун (1 декабря 2012 г.). «CD-HIT: ускорение для кластеризации данных секвенирования следующего поколения» . Биоинформатика . 28 (23): 3150–3152. doi : 10.1093/биоинформатика/bts565 . ISSN 1367-4803 . ПМК 3516142 . ПМИД 23060610 .
- ^ Хао, X.; Цзян, Р.; Чен, Т. (2011). «Кластеризация 16S рРНК для предсказания OTU: метод неконтролируемой байесовской кластеризации» . Биоинформатика . 27 (5): 611–618. doi : 10.1093/биоинформатика/btq725 . ПМК 3042185 . ПМИД 21233169 .
Дальнейшее чтение
[ редактировать ]- Чен, В.; Чжан, СК; Ченг, Ю.; Чжан, С.; Чжао, Х. (2013). « Сравнение методов кластеризации последовательностей 16S рРНК в OTU » . ПЛОС ОДИН . 8 (8): e70837. Бибкод : 2013PLoSO...870837C . дои : 10.1371/journal.pone.0070837 . ПМЦ 3742672 . ПМИД 23967117 .