Регион кодирования
Кодирующая область гена ( , также известная как кодирующая последовательность ) CDS , представляет собой часть ДНК или РНК гена , которая кодирует белок . [1] Изучение длины, состава, регуляции, сплайсинга, структуры и функций кодирующих областей по сравнению с некодирующими областями на протяжении разных видов и периодов времени может предоставить значительный объем важной информации относительно организации генов и эволюции прокариот и эукариот . [2] Это может также помочь в картировании генома человека и разработке генной терапии. [3]
Определение
[ редактировать ]Хотя этот термин также иногда используется взаимозаменяемо с экзоном , это не одно и то же: экзон состоит из кодирующей области, а также 3'- и 5'- нетранслируемых областей РНК, поэтому экзон будет называться частично состоит из кодирующих областей. 3'- и 5'- нетранслируемые области РНК, которые не кодируют белок, называются некодирующими областями и не обсуждаются на этой странице. [4]
Часто возникает путаница между кодирующими областями и экзомами , и между этими терминами существует четкое различие. В то время как экзом относится ко всем экзонам в геноме, кодирующая область относится к отдельному участку ДНК или РНК, который специфически кодирует определенный вид белка.
История
[ редактировать ]В 1978 году Уолтер Гилберт опубликовал книгу «Почему гены разбиты на части», в которой впервые началось исследование идеи о том, что ген представляет собой мозаику — что каждая полная цепь нуклеиновой кислоты не кодируется непрерывно, а прерывается «молчащими» некодирующими областями. Это было первым признаком того, что необходимо проводить различие между частями генома, кодирующими белок, которые теперь называются кодирующими областями, и теми, которые этого не делают. [5]
Состав
[ редактировать ]Имеющиеся данные свидетельствуют о том, что существует общая взаимозависимость между шаблонами базового состава и доступностью региона кодирования. [6] Считается, что кодирующая область содержит более высокое содержание GC, чем некодирующие области. Дальнейшие исследования показали, что чем длиннее кодирующая цепь, тем выше содержание GC. Короткие кодирующие цепи все еще сравнительно бедны GC, подобно низкому содержанию GC в стоп-кодонах трансляции базовой композиции , таких как TAG, TAA и TGA. [7]
Области, богатые GC, также немного изменяются в областях, где тип мутации точки отношения меняется: здесь больше переходов , которые представляют собой изменения от пурина к пурину или от пиримидина к пиримидину, по сравнению с трансверсиями , которые представляют собой изменения от пурина к пиримидину или от пиримидина к пурину. Переходы с меньшей вероятностью изменяют кодируемую аминокислоту и остаются молчащей мутацией (особенно если они происходят в третьем нуклеотиде кодона), что обычно полезно для организма во время трансляции и образования белка. [8]
Это указывает на то, что существенные кодирующие области (богатые генами) имеют более высокое содержание GC, более стабильны и устойчивы к мутациям по сравнению с дополнительными и несущественными областями (бедными генами). [9] Однако до сих пор неясно, произошло ли это в результате нейтральной и случайной мутации или в результате отбора . [10] Также ведутся споры о том, являются ли методы, используемые, такие как генные окна, для установления взаимосвязи между содержанием GC и кодирующей областью, точными и беспристрастными. [11]
Структура и функции
[ редактировать ]В ДНК кодирующая область фланкирована последовательностью промотора на 5'-конце цепи матрицы и терминирующей последовательностью на 3'-конце. Во время транскрипции РНК -полимераза (РНКП) связывается с последовательностью промотора и перемещается по цепи матрицы к кодирующей области. Затем РНКП добавляет нуклеотиды РНК , комплементарные кодирующей области, чтобы сформировать мРНК , урацилом заменяя тимин . [12] Это продолжается до тех пор, пока РНКП не достигнет последовательности терминации. [12]
После транскрипции и созревания образующаяся зрелая мРНК включает в себя множество частей, важных для ее возможной трансляции в белок . Кодирующая область мРНК фланкирована 5'-нетранслируемой областью (5'-UTR) и 3'-нетранслируемой областью (3'-UTR). [1] и 5-футовая крышка хвост Poly-A . Во время трансляции рибосома кодирующей области по облегчает прикрепление тРНК к 3 нуклеотида за раз ( кодоны ). [13] ТРНК переносят связанные с ними аминокислоты в растущую полипептидную цепь, в конечном итоге образуя белок, определенный в исходной кодирующей области ДНК.
Регулирование
[ редактировать ]Кодирующая область может быть модифицирована для регулирования экспрессии генов.
Алкилирование является одной из форм регуляции кодирующей области. [15] Ген, который должен был быть транскрибирован, можно заставить замолчать, нацелившись на определенную последовательность. Основания в этой последовательности будут блокироваться с помощью алкильных групп , которые создают эффект молчания . [16]
Хотя регуляция экспрессии генов управляет обилием РНК или белка, образующихся в клетке, регуляция этих механизмов может контролироваться регуляторной последовательностью, обнаруженной до того, как открытая рамка считывания в цепи ДНК начнется . Регуляторная последовательность затем будет определять место и время, когда будет происходить экспрессия области, кодирующей белок. [17]
Сплайсинг РНК в конечном итоге определяет, какая часть последовательности транслируется и экспрессируется, и этот процесс включает вырезание интронов и соединение экзонов. РНК Однако место разрезания сплайсосомы определяется распознаванием сайтов сплайсинга , в частности 5'-сайта сплайсинга, который является одним из субстратов для первого этапа сплайсинга. [18] Кодирующие области находятся внутри экзонов, которые ковалентно соединяются вместе, образуя зрелую информационную РНК .
Мутации
[ редактировать ]Мутации в кодирующей области могут оказывать весьма разнообразное влияние на фенотип организма. Хотя некоторые мутации в этой области ДНК/РНК могут привести к полезным изменениям, другие могут быть вредными, а иногда даже смертельными для выживания организма. Напротив, изменения в некодирующей области не всегда могут приводить к обнаруживаемым изменениям фенотипа.
Типы мутаций
[ редактировать ]Существуют различные формы мутаций, которые могут возникать в кодирующих регионах. Одной из форм являются молчащие мутации , при которых изменение нуклеотидов не приводит к каким-либо изменениям аминокислот после транскрипции и трансляции. [20] Существуют также нонсенс-мутации , при которых изменения оснований в кодирующей области кодируют преждевременный стоп-кодон, образуя более короткий конечный белок. Точечные мутации или изменения одной пары оснований в кодирующей области, которые кодируют разные аминокислоты во время трансляции, называются миссенс-мутациями . Другие типы мутаций включают мутации сдвига рамки считывания, такие как вставки или делеции . [20]
Формирование
[ редактировать ]Некоторые формы мутаций являются наследственными ( мутации зародышевой линии ) или передаются от родителя к потомству. [21] Такие мутированные кодирующие области присутствуют во всех клетках организма. Другие формы мутаций приобретаются ( соматические мутации ) в течение жизни организма и не могут быть постоянными от клетки к клетке. [21] Эти изменения могут быть вызваны мутагенами , канцерогенами или другими агентами окружающей среды (например, УФ ). Приобретенные мутации также могут быть результатом ошибок копирования во время репликации ДНК и не передаются потомству. Изменения в области кодирования также могут быть de novo (новыми); Считается, что такие изменения происходят вскоре после оплодотворения , что приводит к мутации, присутствующей в ДНК потомства, но отсутствующей как в сперматозоидах, так и в яйцеклетках. [21]
Профилактика
[ редактировать ]Существует множество механизмов транскрипции и трансляции, позволяющих предотвратить летальность из-за вредных мутаций в кодирующей области. Такие меры включают корректуру с помощью некоторых ДНК-полимераз во время репликации, исправление несоответствий после репликации, [22] и « гипотеза колебания », которая описывает вырождение третьего основания внутри кодона мРНК. [23]
Области ограниченного кодирования (CCR)
[ редактировать ]Хотя хорошо известно, что геном одного человека может иметь значительные различия по сравнению с геномом другого, недавние исследования показали, что некоторые кодирующие области сильно ограничены или устойчивы к мутациям между особями одного и того же вида. Это похоже на концепцию межвидового ограничения в консервативных последовательностях . Исследователи назвали эти сильно ограниченные последовательности ограниченными кодирующими областями (CCR), а также обнаружили, что такие области могут участвовать в отборе с высокой степенью очистки . В среднем на каждые 7 кодирующих оснований приходится примерно 1 мутация, изменяющая белок, но некоторые CCR могут иметь более 100 оснований в последовательности без наблюдаемых мутаций, изменяющих белок, а некоторые даже без синонимичных мутаций. [24] Эти закономерности ограничения между геномами могут дать ключ к разгадке источников редких заболеваний развития или, возможно, даже эмбриональной смертности. Клинически подтвержденные варианты и мутации de novo в CCR ранее были связаны с такими расстройствами, как детская эпилептическая энцефалопатия , задержка развития и тяжелые заболевания сердца. [24]
Обнаружение последовательности кодирования
[ редактировать ]Хотя идентификация открытых рамок считывания в последовательности ДНК является простой задачей, идентификация кодирующих последовательностей не является сложной задачей, поскольку клетка транслирует в белки только подмножество всех открытых рамок считывания. [26] В настоящее время для прогнозирования CDS используется отбор проб и секвенирование мРНК из клеток, хотя все еще существует проблема определения того, какие части данной мРНК на самом деле транслируются в белок. Прогнозирование CDS — это подмножество предсказания генов , причем последнее также включает предсказание последовательностей ДНК, которые кодируют не только белок, но и другие функциональные элементы, такие как гены РНК и регуляторные последовательности.
Как у прокариот так и у эукариот , перекрытие генов происходит относительно часто как в ДНК, так и в РНК-содержащих вирусах, что является эволюционным преимуществом, позволяющим уменьшить размер генома, сохраняя при этом способность производить различные белки из доступных кодирующих областей. [27] [28] Как для ДНК, так и для РНК парное выравнивание может обнаружить перекрывающиеся кодирующие области, включая короткие открытые рамки считывания в вирусах, но для сравнения с потенциальной перекрывающейся кодирующей цепью потребуется известная кодирующая цепь. [29] Альтернативный метод, использующий отдельные последовательности генома, не потребует нескольких последовательностей генома для выполнения сравнений, но потребует перекрытия как минимум 50 нуклеотидов, чтобы быть чувствительным. [30]
См. также
[ редактировать ]- Кодирующая цепь: Нить ДНК, кодирующая белок.
- Экзон Вся транскрибируемая часть цепи
- Зрелая мРНК. Часть продукта транскрипции мРНК, которая транслируется.
- Структура гена Другие элементы, составляющие ген.
- Вложенный ген. Вся кодирующая последовательность находится в пределах более крупного внешнего гена.
- Некодирующая ДНК Части генома, не кодирующие гены, кодирующие белки.
- Некодирующие молекулы РНК, которые не кодируют белки и поэтому не имеют CDS.
- Нефункциональная ДНК. Части генома, не имеющие соответствующей биологической функции.
Ссылки
[ редактировать ]- ^ Jump up to: а б Твайман, Ричард (1 августа 2003 г.). «Генная структура» . Велком Траст. Архивировано из оригинала 28 марта 2007 года . Проверено 6 апреля 2003 г.
- ^ Хёглунд М., Салл Т., Реме Д. (февраль 1990 г.). «О происхождении кодирующих последовательностей из случайных открытых рамок считывания». Журнал молекулярной эволюции . 30 (2): 104–108. Бибкод : 1990JMolE..30..104H . дои : 10.1007/bf02099936 . ISSN 0022-2844 . S2CID 5978109 .
- ^ Сахаркар М.К., Чоу В.Т., Кангеан П. (2004). «Распределение экзонов и интронов в геноме человека». В кремниевой биологии . 4 (4): 387–93. ПМИД 15217358 .
- ^ Парнелл, Лоуренс Д. (1 января 2012 г.). «Достижения в области технологий и дизайна исследований» . В Бушаре, К.; Ордовас, Дж. М. (ред.). Последние достижения в области нутригенетики и нутригеномики . Том. 108. Академическая пресса. стр. 17–50. дои : 10.1016/B978-0-12-398397-8.00002-2 . ISBN 9780123983978 . ПМИД 22656372 . Проверено 07.11.2019 .
{{cite book}}
:|journal=
игнорируется ( помогите ) - ^ Гилберт В. (февраль 1978 г.). «Почему гены разбиты на кусочки?» . Природа . 271 (5645): 501. Бибкод : 1978Natur.271..501G . дои : 10.1038/271501a0 . ПМИД 622185 . S2CID 4216649 .
- ^ Лерчер М.Дж., Уррутия А.О., Павличек А., Херст Л.Д. (октябрь 2003 г.). «Объединение мозаичных структур в геноме человека» . Молекулярная генетика человека . 12 (19): 2411–5. дои : 10.1093/hmg/ddg251 . ПМИД 12915446 .
- ^ Оливер Дж.Л., Марин А. (сентябрь 1996 г.). «Взаимосвязь между содержанием GC и длиной кодирующей последовательности». Журнал молекулярной эволюции . 43 (3): 216–23. Бибкод : 1996JMolE..43..216O . дои : 10.1007/pl00006080 . ПМИД 8703087 .
- ^ «РОЗАЛИНДА | Глоссарий | Область кодирования гена» . rosalind.info . Проверено 31 октября 2019 г.
- ^ Виноградов А.Е. (апрель 2003 г.). «Спираль ДНК: важность богатства GC» . Исследования нуклеиновых кислот . 31 (7): 1838–44. дои : 10.1093/нар/gkg296 . ПМК 152811 . ПМИД 12654999 .
- ^ Болин Дж., Элдхольм В., Петтерссон Дж. Х., Бринильдсруд О., Снипен Л. (февраль 2017 г.). «Нуклеотидный состав микробных геномов указывает на различные закономерности отбора основных и дополнительных геномов» . БМК Геномика . 18 (1): 151. дои : 10.1186/s12864-017-3543-7 . ПМК 5303225 . ПМИД 28187704 .
- ^ Семон М., Муширу Д., Дюре Л. (февраль 2005 г.). «Связь между экспрессией генов и содержанием GC у млекопитающих: статистическая значимость и биологическая значимость» . Молекулярная генетика человека . 14 (3): 421–7. дои : 10.1093/hmg/ddi038 . ПМИД 15590696 .
- ^ Jump up to: а б Обзор транскрипции. (н-й). Получено с https://www.khanacademy.org/science/biology/gene-expression-central-dogma/transcription-of-dna-into-rna/a/overview-of-transcription .
- ^ Клэнси, Сюзанна (2008). «Перевод: ДНК в мРНК в белок» . Scitable: естественное образование .
- ^ Plociam (08 августа 2005 г.), английский: Структура мРНК зрелых эукариот. Полностью процессированная мРНК включает 5'-кэп, 5'-UTR, кодирующую область, 3'-UTR и поли(А)-хвост. , получено 19 ноября 2019 г.
- ^ Шинохара К., Сасаки С., Миношима М., Бандо Т., Сугияма Х. (13 февраля 2006 г.). «Алкилирование матричной цепи кодирующей области вызывает эффективное подавление генов» . Исследования нуклеиновых кислот . 34 (4): 1189–95. дои : 10.1093/нар/gkl005 . ПМЦ 1383623 . ПМИД 16500890 .
- ^ «Термин онтологии гена алкилирования ДНК (GO: 0006305)» . www.informatics.jax.org . Проверено 30 октября 2019 г.
- ^ Шафи Т., Лоу Р. (2017). «Строение генов эукариот и прокариот» . Викижурнал медицины . 4 (1). дои : 10.15347/wjm/2017.002 .
- ^ Конарская М.М. (1998). «Распознавание 5'-сайта сплайсинга сплайсосомой» . Акта Биохимика Полоника . 45 (4): 869–81. дои : 10.18388/abp.1998_4346 . ПМИД 10397335 .
- ^ Jonsta247 (10 мая 2013 г.), английский: Пример молчащей мутации , получено 19 ноября 2019 г.
{{citation}}
: CS1 maint: числовые имена: список авторов ( ссылка ) - ^ Jump up to: а б Ян, Дж. (23 марта 2016 г.). Что такое генетические мутации? Получено с https://www.singerinstruments.com/resource/what-are-genetic-mutation/ .
- ^ Jump up to: а б с Что такое генная мутация и как происходят мутации? - Домашний справочник по генетике - NIH. (н-й). Получено с https://ghr.nlm.nih.gov/primer/mutationsanddisorders/genemutation .
- ^ «Корректура и ремонт ДНК (статья)» . Ханская академия . Проверено 22 мая 2023 г.
- ^ Перето Дж. (2011) Гипотеза колебания (генетика). В: Гарго М. и др. (ред.) Энциклопедия астробиологии. Шпрингер, Берлин, Гейдельберг
- ^ Jump up to: а б Хаврилла Дж. М., Педерсен Б. С., Лайер Р. М. и Куинлан А. Р. (2018). Карта областей ограниченного кодирования в геноме человека. Природная генетика , 88–95. дои : 10.1101/220814
- ^ Ромигье Ж, Ру С (2017). «Аналитические предубеждения, связанные с содержанием GC в молекулярной эволюции» . Фронт Генет . 8 : 16. дои : 10.3389/fgene.2017.00016 . ПМК 5309256 . ПМИД 28261263 .
- ^ Фуруно М., Касукава Т., Сайто Р., Адачи Дж., Сузуки Х., Балдарелли Р. и др. (июнь 2003 г.). «Аннотация CDS в полноразмерной последовательности кДНК» . Геномные исследования . 13 (6Б). Лабораторное издательство Колд-Спринг-Харбор: 1478–87. дои : 10.1101/гр.1060303 . ПМК 403693 . ПМИД 12819146 .
- ^ Рогозин И.Б., Спиридонов А.Н., Сорокин А.В., Вольф Ю.И., Йордан И.К., Татусов Р.Л., Кунин Е.В. (май 2002 г.). «Очистка и направленный отбор в перекрывающихся генах прокариот» . Тенденции в генетике . 18 (5): 228–32. дои : 10.1016/S0168-9525(02)02649-5 . ПМИД 12047938 .
- ^ Кирико Н., Вианелли А., Белшоу Р. (декабрь 2010 г.). «Почему гены у вирусов перекрываются» . Слушания. Биологические науки . 277 (1701): 3809–17. дои : 10.1098/rspb.2010.1052 . ПМЦ 2992710 . ПМИД 20610432 .
- ^ Ферт А.Э., Браун К.М. (февраль 2005 г.). «Обнаружение перекрывающихся кодирующих последовательностей с попарным выравниванием» . Биоинформатика . 21 (3): 282–92. doi : 10.1093/биоинформатика/bti007 . ПМИД 15347574 .
- ^ Шлуб Т.Э., Бухманн Дж.П., Холмс Э.К. (октябрь 2018 г.). Малик Х (ред.). «Простой метод обнаружения перекрывающихся генов-кандидатов в вирусах с использованием последовательностей одного генома» . Молекулярная биология и эволюция . 35 (10): 2572–2581. дои : 10.1093/molbev/msy155 . ПМК 6188560 . ПМИД 30099499 .