TopHat (биоинформатика)
TopHat инструмент с открытым исходным кодом — это биоинформатический для выравнивания пропускной способности считываний секвенирования кДНК методом дробовика, генерируемых с помощью технологий транскриптомики (например, RNA-Seq ), сначала с использованием Bowtie , а затем сопоставления с эталонным геномом для обнаружения сайтов сплайсинга РНК de novo . [1] TopHat согласовывает считывания RNA-Seq с геномами размером с млекопитающих. [2]
История [ править ]
TopHat был первоначально разработан в 2009 году Коулом Трапнеллом , Лиором Пачтером и Стивеном Зальцбергом в Центре биоинформатики и вычислительной биологии Университета Мэриленда в Колледж-Парке и на математическом факультете Калифорнийского университета в Беркли . [1] TopHat2 был результатом совместной работы Дэхвана Кима и Стивена Зальцберга, сначала в Университете Мэриленда, Колледж-Парк , а затем в Центре вычислительной биологии Университета Джонса Хопкинса . Ким переписал часть исходного кода TopHat Трапнелла на C++ , чтобы сделать его намного быстрее, и добавил множество эвристик для повышения его точности в сотрудничестве с Коулом Трапнеллом и другими. Ким и Зальцберг также разработали метод TopHat-fusion, который использовал данные транскриптома для обнаружения слияний генов в раковых тканях. [3]
Использует [ править ]
TopHat используется для выравнивания показаний эксперимента RNA-Seq. Это алгоритм сопоставления чтения, который выравнивает чтения с эталонным геномом. Это полезно, поскольку не нужно полагаться на известные сайты сплайсинга. [1] TopHat может использоваться с конвейером Tuxedo и часто используется с Bowtie .
Преимущества/недостатки [ править ]
Преимущества [ править ]
Когда TopHat впервые появился, он был быстрее предыдущих систем. Он сопоставил более 2,2 миллиона операций чтения за час процессора. Такая скорость позволяла пользователю провести весь эксперимент по секвенированию РНК менее чем за день даже на стандартном настольном компьютере. [1] Тофат вначале использует Bowtie для анализа чтений, а затем делает больше для анализа считываний, охватывающих соединения экзон-экзон. Если вы используете TopHat для данных RNA-Seq, вы получите больше считываний, сопоставленных с эталонным геномом. [4]
Еще одним преимуществом TopHat является то, что ему не нужно полагаться на известные сайты сплайсинга при сопоставлении прочтений с эталонным геномом. [1]
Недостатки [ править ]
TopHat находится на стадии минимального обслуживания и поддержки и содержит программные ошибки, которые потребовали исправления сторонним программным обеспечением постобработки. [5] Его заменил HISAT2, который более эффективен и точен и обеспечивает ту же основную функциональность (сплайсированное выравнивание считываний RNA-Seq). [2]
См. также [ править ]
- Галстук-бабочка (анализ последовательности)
- Список инструментов биоинформатики RNA-Seq
- Методы микроматричного анализа
- секвенирование следующего поколения
- РНК-Seq
Ссылки [ править ]
- ^ Jump up to: а б с д и Трапнелл С., Пахтер Л., Зальцберг С.Л. (май 2009 г.). «TopHat: обнаружение соединений сплайсинга с помощью RNA-Seq» . Биоинформатика . 25 (9): 1105–11. doi : 10.1093/биоинформатика/btp120 . ПМЦ 2672628 . ПМИД 19289445 .
- ^ Jump up to: а б «ТопХэт» . ccb.jhu.edu . Проверено 17 апреля 2018 г.
- ^ Ким Д., Пертеа Г., Трапнелл С., Пиментел Х., Келли Р., Зальцберг С.Л. (апрель 2013 г.). «TopHat2: точное выравнивание транскриптомов при наличии вставок, делеций и слияний генов» . Геномная биология . 14 (4): С36. дои : 10.1186/gb-2013-14-4-r36 . ПМК 4053844 . ПМИД 23618408 .
- ^ «Галстук-бабочка и цилиндр» . www.biostars.org . Проверено 24 апреля 2018 г.
- ^ Брюффер К., Саал Л.Х. (май 2016 г.). «TopHat-Recondition: постпроцессор для несопоставленных операций чтения TopHat» . БМК Биоинформатика . 17 (1): 199. дои : 10.1186/s12859-016-1058-x . ПМЦ 4855331 . ПМИД 27142976 .