Горизонтальная корреляция
Эта статья нуждается в дополнительных цитатах для проверки . ( январь 2008 г. ) |
Горизонтальная корреляция — это методология анализа последовательности генов . Вместо того, чтобы ссылаться на один конкретный метод, горизонтальная корреляция включает в себя множество подходов к анализу последовательностей, которые объединены двумя конкретными темами:
- Анализ последовательностей выполняется путем горизонтального сравнения по длине одной генетической последовательности; в этом отличие от вертикальных методов, которые сравнивают несколько различных генетических последовательностей.
- Проведенные сравнения обычно измеряют теоретические величины информации, такие как значение функции взаимной информации между двумя областями последовательности.
Основные идеи подхода горизонтальной корреляции были впервые представлены в 2000 году в статье Гроссе, Герцеля, Булдырева и Стэнли (Grosse et al., 2000). В этой первой формулировке Гросс и его коллеги стремились охарактеризовать большую генетическую последовательность, разделив ее на кодирующие и некодирующие области. В то время как традиционные подходы к проблеме кодирования и некодирования обычно основывались на сложных системах распознавания образов, которые сначала обучались на небольших входных данных, а затем обрабатывали всю последовательность (Ohler, et al. 1999), подход горизонтальной корреляции Гроссе и его коллеги вместо этого разбили последовательность на множество относительно коротких фрагментов последовательности, каждый длиной всего 500 пар оснований. Затем они попытались охарактеризовать каждый из этих фрагментов как кодирующий или некодирующий. Это было достигнуто путем сравнения каждого окна размера 3 по длине фрагмента с первым окном размера 3 в этом фрагменте, а затем измерения значения функции взаимной информации между двумя окнами. Было обнаружено, что кодирующие последовательности демонстрируют стилизованный паттерн 3-периодичности, которого не было у некодирующих последовательностей. Такую закономерность было легко распознать, и она позволяла значительно быстрее и более независимо от вида идентифицировать кодирующие регионы (Grosse et al. 2000).
С 2000 года методологии горизонтальной корреляции, делающие упор на измерении теоретических величин по длине последовательности гена, получили широкое распространение и даже нашли применение при сборке фрагментов дробового секвенирования (Otu & Sayood, 2004).
Ссылки
[ редактировать ]- Гросс, Иво; Герцель, Ханспетер; Булдырев Сергей В.; Стэнли, Х. Юджин (1 мая 2000 г.). «Видовая независимость взаимной информации в кодирующей и некодирующей ДНК». Физический обзор E . 61 (5). Американское физическое общество (APS): 5624–5629. Бибкод : 2000PhRvE..61.5624G . дои : 10.1103/physreve.61.5624 . ISSN 1063-651X . ПМИД 11031617 .
- Олер, У.; Харбек, С.; Ниманн, Х.; Нот, Э.; Риз, МГ (1 мая 1999 г.). «Интерполированные цепи Маркова для распознавания эукариотических промоторов» . Биоинформатика . 15 (5). Издательство Оксфордского университета (OUP): 362–369. дои : 10.1093/биоинформатика/15.5.362 . ISSN 1367-4803 . ПМИД 10366656 .
- Оту, Х.Х.; Саюд, К. (1 января 2003 г.). «Подход к сборке фрагментов по принципу «разделяй и властвуй». Биоинформатика . 19 (1). Издательство Оксфордского университета (OUP): 22–29. дои : 10.1093/биоинформатика/19.1.22 . ISSN 1367-4803 . ПМИД 12499289 .