Последовательность исследования генома
В области биоинформатики и биологии вычислительной последовательности исследования генома (GSS) представляют собой нуклеотидные последовательности, аналогичные меткам экспрессируемых последовательностей (EST), с той лишь разницей, что большинство из них имеют геномное происхождение, а не мРНК . [1]
Последовательности геномных исследований обычно генерируются и передаются в NCBI лабораториями, выполняющими секвенирование генома , и используются, среди прочего, в качестве основы для картирования и секвенирования фрагментов генома, включенных в стандартные подразделения GenBank . [1]
Взносы
[ редактировать ]Секвенирование генома — это новый способ картирования последовательностей генома, поскольку он не зависит от мРНК . Современные подходы к секвенированию генома в основном представляют собой высокопроизводительные методы, и GSS часто используется на первом этапе секвенирования. GSS могут обеспечить начальное глобальное представление о геноме, который включает как кодирующую, так и некодирующую ДНК и содержит повторяющиеся участки генома, в отличие от EST . Для оценки повторяющихся последовательностей GSS играет важную роль на ранней оценке проекта секвенирования, поскольку эти данные могут повлиять на оценку покрытия последовательностей, качества библиотеки и процесса построения. [2] Например, при оценке генома собаки он может оценить глобальные параметры, такие как частота нейтральных мутаций и содержание повторов. [3]
GSS также является эффективным способом крупномасштабной и быстрой характеристики геномов родственных видов, где имеется лишь небольшое количество последовательностей или карт генов. [4] GSS с низким охватом может дать обширную информацию о содержании генов и предполагаемых регуляторных элементах сравнительных видов. [5] Он может сравнивать эти гены родственных видов, чтобы выявить относительно расширенные или сокращенные семейства. А в сочетании с физическим покрытием клонов исследователи могут легко ориентироваться в геноме и охарактеризовать конкретный участок генома с помощью более обширного секвенирования. [3]
Ограничение
[ редактировать ]Ограничением последовательности геномного исследования является отсутствие долговременной непрерывности из-за ее фрагментарного характера, что затрудняет прогнозирование порядка генов и маркеров. Например, для обнаружения повторяющихся последовательностей в данных GSS может оказаться невозможным обнаружить все повторы, поскольку повторяющийся геном может быть длиннее, чем чтения, что трудно распознать. [2]
Типы данных
[ редактировать ]Раздел GSS содержит (но не ограничивается) следующие типы данных:
Случайные последовательности исследования генома «однократного чтения»
[ редактировать ]Случайные последовательности исследования генома «однократного чтения» представляют собой GSS, которые генерируются в ходе однопроходного чтения путем случайного выбора. Однопроходное секвенирование с меньшей точностью можно использовать для быстрого накопления геномных данных, но с меньшей точностью. [6] В него входят RAPD , RFLP , AFLP и так далее. [7]
Концевые последовательности Космиды/BAC/YAC
[ редактировать ]В концевых последовательностях Cosmid/BAC/YAC используется космида / бактериальная искусственная хромосома / дрожжевая искусственная хромосома для секвенирования генома с конечной стороны. Эти последовательности действуют как плазмиды с очень низким содержанием копий: иногда на клетку приходится только одна копия. Чтобы получить достаточное количество хромосом, им необходимо большое количество культуры E. coli: 2,5–5 литров могут быть разумным количеством. [8]
Cosmid/BAC/YAC также можно использовать для получения более крупного клона фрагмента ДНК, чем такие векторы, как плазмида и фагемида. Вставка большего размера часто полезна для проекта последовательности при организации клонов. [9]
Эукариотические белки можно экспрессировать с помощью YAC с посттрансляционной модификацией. [10] BAC не может этого сделать, но BAC может достоверно представлять человеческую ДНК гораздо лучше, чем YAC или космида. [11]
экзоном Геномные последовательности, захваченные
[ редактировать ]Последовательность, захваченная экзоном, используется для идентификации генов в клонированной ДНК, и это достигается путем распознавания и улавливания последовательности ДНК, содержащей носитель, содержащий экзон. Захват экзона имеет две основные особенности: во-первых, он не зависит от наличия РНК, экспрессирующей ДНК-мишень. Во-вторых, изолированные последовательности можно получить непосредственно из клона, не зная тканей, экспрессирующих ген, который необходимо идентифицировать. [12] Во время срезов экзон может оставаться в мРНК, а информация, которую несет экзон, может содержаться в белке. Поскольку фрагмент ДНК может быть вставлен в последовательность, если экзон вставлен в интрон, транскрипт будет длиннее, чем обычно, и этот транскрипт можно будет уловить с помощью анализа.
Alu- ПЦР- последовательности
[ редактировать ]Повторяющийся элемент Alu является членом группы коротких вкраплений (SINE) в геноме млекопитающих. В геноме человека имеется от 300 до 500 тысяч копий повторяющегося элемента Alu, что означает, что один элемент Alu существует в среднем в 4-6 т.п.н. Элементы Alu широко распространены в геноме млекопитающих, и повторяемость является одной из характеристик, поэтому его называют повторяющимся элементом Alu. Используя специальную последовательность Alu в качестве целевого локуса, специфическую ДНК человека можно получить из клона TAC, BAC, PAC или гибрида клеток человека и мыши.
ПЦР — это метод, используемый для клонирования небольшого фрагмента ДНК. Фрагмент может представлять собой один ген или просто часть гена. ПЦР позволяет клонировать только очень небольшой фрагмент ДНК, размер которого обычно не превышает 10 т.п.н.
Alu-ПЦР — это метод «дактилоскопии ДНК». Этот подход является быстрым и простым в использовании. Его получают в результате анализа многих геномных локусов, фланкированных повторяющимися элементами Alu, которые представляют собой неавтономные ретротранспозоны, присутствующие в большом количестве копий в геномах приматов. [13] Элемент Alu можно использовать для снятия отпечатков пальцев генома на основе ПЦР, которую также называют Alu PCR.
, меченные транспозонами Последовательности
[ редактировать ]Существует несколько способов проанализировать функцию определенной последовательности гена, наиболее прямой метод — заменить ее или вызвать мутацию , а затем проанализировать результаты и эффекты. Для этой цели разработаны три метода: замена генов, смысловая и антисмысловая супрессия и инсерционный мутагенез . Среди этих методов инсерционный мутагенез оказался очень хорошим и успешным подходом.
Сначала Т-ДНК применяли для инсерционного мутагенеза. Однако использование мобильного элемента может принести больше преимуществ. Мобильные элементы были впервые обнаружены Барбарой МакКлинток в растениях кукурузы . Она идентифицировала первый мобильный генетический элемент, который она назвала локусом диссоциации (Ds). [14] Размер мобильного элемента составляет от 750 до 40000 пар оснований. Мобильные элементы можно в основном разделить на два класса: один класс очень простой, называемый последовательностью вставки (IS), другой класс сложный, называемый транспозоном. Транспозон имеет один или несколько охарактеризованных генов, которые легко идентифицировать. IS имеет ген транспозазы.
Транспозон можно использовать в качестве метки для ДНК с известной последовательностью. Транспозон может появиться в другом локусе посредством транскрипции или обратной транскрипции под действием нуклеазы. Появление транспозона доказало, что геном не является статистическим, а постоянно меняет свою структуру.
Использование мечения транспозонов дает два преимущества. Во-первых, если транспозон вставлен в последовательность гена, эта вставка будет одиночной и неповрежденной. Неповрежденность позволяет легко подвергнуть меченую последовательность молекулярному анализу. Другое преимущество состоит в том, что при транспозазы анализе можно обнаружить, что многие транспозоны исключены из последовательности меченого гена. Это обеспечивает подтверждение того, что вставленная последовательность гена действительно была помечена транспозоном. [15]
Пример файла GSS
[ редактировать ]Ниже приведен пример файла GSS, который можно отправить в GenBank: [16]
TYPE: GSS STATUS: New CONT_NAME: Sikela JM GSS#: Ayh00001 CLONE: HHC189 SOURCE: ATCC SOURCE_INHOST: 65128 OTHER_GSS: GSS00093, GSS000101 CITATION: Genomic sequences from Human brain tissue SEQ_PRIMER: M13 Forward P_END: 5' HIQUAL_START: 1 HIQUAL_STOP: 285 DNA_TYPE: Genomic CLASS: shotgun LIBRARY: Hippocampus, Stratagene (cat. #936205) PUBLIC: PUT_ID: Actin, gamma, skeletal COMMENT: SEQUENCE: AATCAGCCTGCAAGCAAAAGATAGGAATATTCACCTACAGTGGGCACCTCCTTAAGAAGCTG ATAGCTTGTTACACAGTAATTAGATTGAAGATAATGGACACGAAACATATTCCGGGATTAAA CATTCTTGTCAAGAAAGGGGGAGAGAAGTCTGTTGTGCAAGTTTCAAAGAAAAAGGGTACCA GCAAAAGTGATAATGATTTGAGGATTTCTGTCTCTAATTGGAGGATGATTCTCATGTAAGGT GCAAAAGTGATAATGATTTGAGGATTTCTGTCTCTAATTGGAGGATGATTCTCATGTAAGGT TGTTAGGAAATGGCAAAGTATTGATGATTGTGTGCTATGTGATTGGTGCTAGATACTTTAAC TGAGTATACGAGTGAAATACTTGAGACTCGTGTCACTT ||
Ссылки
[ редактировать ]- ^ Перейти обратно: а б Примечания к выпуску плоского файла GenBank 96.0
- ^ Перейти обратно: а б Отто, Томас Д. и др. «ReRep: Компьютерное обнаружение повторяющихся последовательностей в последовательностях исследования генома (GSS)». Биоинформатика Bmc 9.1 (2008): 366.
- ^ Перейти обратно: а б Киркнесс, Э.Ф. (26 сентября 2003 г.). «Геном собаки: секвенирование опроса и сравнительный анализ». Наука . 301 (5641). Американская ассоциация развития науки (AAAS): 1898–1903 гг. Бибкод : 2003Sci...301.1898K . дои : 10.1126/science.1086432 . ISSN 0036-8075 . ПМИД 14512627 . S2CID 22366556 .
- ^ Венкатеш, Байраппа и др. «Обзорное секвенирование и сравнительный анализ генома слоновой акулы (Callorhinchus milii)». PLoS биология 5.4 (2007): e101.
- ^ Хитте, Кристоф и др. «Облегчение навигации по геному: обзорное секвенирование и плотное радиационно-гибридное картирование генов». Nature Reviews Genetics 6.8 (2005): 643-648.
- ^ «Секвенирование ДНК. Как определить последовательность оснований в молекуле ДНК» . Архивировано из оригинала 21 октября 2013 г. Проверено 21 октября 2013 г.
- ^ DDBJ-GSS
- ^ МЕГА- и GIGA-препараты космид-, BAC-, PAC, YAC- и P1-ДНК с помощью JETSTAR 2.0
- ^ «WSSP-04 Глава 2 — Векторы» (PDF) . Архивировано из оригинала (PDF) 23 октября 2013 г. Проверено 22 октября 2013 г.
- ^ Дрожжевая искусственная хромосома
- ^ Вентер, Дж. Крейг, Гамильтон О. Смит и Лерой Худ. «Новая совместная стратегия секвенирования человеческого и других геномов».
- ^ Мартин К. Вапенаар; Йохан Т. Ден Даннен (2001). Захват экзонов: применение системы захвата нескольких экзонов с большой вставкой . Методы молекулярной биологии. Том. 175. С. 201–215. дои : 10.1385/1-59259-235-X:201 . ISBN 978-1-59259-235-7 . ПМИД 11462836 .
- ^ Карделли М (2011). «Алю ПЦР». Протоколы ПЦР . Методы молекулярной биологии. Том. 687. стр. 221–9. дои : 10.1007/978-1-60761-944-4_15 . ISBN 978-1-60761-943-7 . ПМИД 20967611 .
- ^ Цугэки Р., Олсон М.Л., Федоров Н.В. (май 2007 г.). «Мечение транспозонов и изучение развития корней арабидопсиса». Гравитационная и космическая биология . 11 (2): 79–87. ПМИД 11540642 .
- ^ Рамачандран С., Сундаресан В. (2001). «Транспозоны как инструменты функциональной геномики». Физиология и биохимия растений . 39 (3–4): 243–252. дои : 10.1016/s0981-9428(01)01243-8 .
- ^ dbGSS_submit