GC-контент
В молекулярной биологии и генетике , содержание GC (или содержание гуанина-цитозина ) — это процент азотистых оснований в молекуле ДНК или РНК которые представляют собой либо гуанин (G), либо цитозин (C). [1] Эта мера показывает долю оснований G и C из четырех предполагаемых оснований, включая аденин и тимин в ДНК и аденин и урацил в РНК.
GC-контент может быть указан для определенного фрагмента ДНК или РНК или для всего генома . Когда оно относится к фрагменту, оно может обозначать GC-содержание отдельного гена или участка гена (домена), группы генов или кластеров генов, некодирующей области или синтетического олигонуклеотида , такого как праймер .
Структура
[ редактировать ]Качественно гуанин (G) и цитозин (C) подвергаются специфической водородной связи друг с другом, тогда как аденин (А) связывается специфически с тимином (Т) в ДНК и с урацилом (U) в РНК. Количественно каждая пара оснований GC удерживается вместе тремя водородными связями, а пары оснований AT и AU удерживаются вместе двумя водородными связями. Чтобы подчеркнуть это различие, пары оснований часто обозначаются как «G≡C» вместо «A=T» или «A=U».
ДНК с низким содержанием GC менее стабильна, чем ДНК с высоким содержанием GC; однако сами водородные связи не оказывают особенно существенного влияния на молекулярную стабильность, которая вместо этого обусловлена главным образом молекулярными взаимодействиями при упаковке оснований. [2] Несмотря на более высокую термостабильность , присущую нуклеиновой кислоте с высоким содержанием GC, было замечено, что по крайней мере некоторые виды бактерий с ДНК с высоким содержанием GC легче подвергаются аутолизу , тем самым уменьшая продолжительность жизни клетки как таковой . [3] Из-за термостабильности пар GC когда-то предполагалось, что высокое содержание GC было необходимой адаптацией к высоким температурам, но эта гипотеза была опровергнута в 2001 году. [4] Несмотря на это, было показано, что существует сильная корреляция между оптимальным ростом прокариот при более высоких температурах и содержанием GC в структурных РНК, таких как рибосомальная РНК , транспортная РНК и многие другие некодирующие РНК . [4] [5] Пары оснований AU менее стабильны, чем пары оснований GC, что делает структуры РНК с высоким содержанием GC более устойчивыми к воздействию высоких температур.
Совсем недавно было продемонстрировано, что наиболее важный фактор, способствующий термической стабильности двухцепочечных нуклеиновых кислот, на самом деле обусловлен укладкой оснований соседних оснований, а не количеством водородных связей между основаниями. Для пар GC более благоприятная энергия упаковки, чем для пар AT или AU, из-за относительного положения экзоциклических групп. Кроме того, существует корреляция между порядком укладки оснований и термической стабильностью молекулы в целом. [6]
Определение
[ редактировать ]Содержание GC обычно выражается в процентах, но иногда и в виде соотношения (так называемое соотношение G+C или соотношение GC ). Процент содержания GC рассчитывается как [7]
тогда как соотношение AT/GC рассчитывается как [8]
- .
Процентное содержание GC, а также соотношение GC можно измерить несколькими способами, но одним из самых простых методов является измерение температуры плавления ДНК двойной спирали с помощью спектрофотометрии . Поглощение довольно резко возрастает , ДНК на длине волны 260 нм когда двухцепочечная молекула ДНК при достаточном нагревании разделяется на две одиночные нити. [9] Наиболее часто используемый протокол определения GC-соотношений использует проточную цитометрию для большого количества образцов. [10]
Альтернативно, если исследуемая молекула ДНК или РНК была надежно секвенирована , то содержание GC можно точно рассчитать с помощью простой арифметики или с помощью различных общедоступных программных инструментов, таких как бесплатный онлайн-калькулятор GC .
Геномный контент
[ редактировать ]Внутригеномная вариация
[ редактировать ]Обнаружено, что соотношение GC в геноме заметно варьирует. Эти изменения в соотношении GC в геномах более сложных организмов приводят к мозаичному образованию с островковыми областями, называемыми изохорами . [11] Это приводит к вариациям интенсивности окрашивания хромосом . [12] Изохоры, богатые GC, обычно включают в себя множество генов, кодирующих белки, и, таким образом, определение соотношений GC в этих конкретных областях способствует картированию богатых генами областей генома. [13] [14]
Кодирующие последовательности
[ редактировать ]В пределах длинной области геномной последовательности гены часто характеризуются более высоким содержанием GC в отличие от фонового содержания GC для всего генома. [15] том, что длина кодирующей области гена Имеются данные о прямо пропорциональна более высокому содержанию G+C. [16] Это было указано на тот факт, что стоп-кодон имеет смещение в сторону нуклеотидов А и Т, и, таким образом, чем короче последовательность, тем выше смещение АТ. [17]
Сравнение более 1000 ортологичных генов млекопитающих показало заметные внутригеномные вариации содержания GC в положении третьего кодона в диапазоне от менее 30% до более 80%. [18]
Межгеномная вариация
[ редактировать ]Было обнаружено, что содержание GC варьируется у разных организмов, и предполагается, что на этот процесс влияют различия в отборе , мутационная предвзятость и предвзятая рекомбинация, связанная с репарацией ДНК . [19]
Среднее содержание GC в геномах человека колеблется от 35% до 60% во фрагментах размером 100 КБ, в среднем 41%. [20] Содержание GC дрожжей ( Saccharomyces cerevisiae ) составляет 38%. [21] а у другого распространенного модельного организма , кресс-салата ( Arabidopsis thaliana ), составляет 36%. [22] Из-за природы генетического кода для организма практически невозможно иметь геном с содержанием GC, приближающимся к 0% или 100%. Однако видом с чрезвычайно низким содержанием GC является Plasmodium falciparum (GC% = ~20%), [23] и обычно такие примеры принято называть богатыми АТ, а не бедными GC. [24]
Несколько видов млекопитающих (например, землероек , летучих мышей , тенреков , кроликов ) независимо претерпели заметное увеличение содержания GC в своих генах. Эти изменения содержания GC коррелируют с особенностями жизненного цикла вида (например, массой тела или продолжительностью жизни) и размером генома . [18] , обусловленной GC и может быть связано с молекулярным явлением, называемым конверсией генов . [25]
Приложения
[ редактировать ]Молекулярная биология
[ редактировать ]В экспериментах с полимеразной цепной реакцией (ПЦР) содержание GC в коротких олигонуклеотидах, известных как праймеры, часто используется для прогнозирования температуры их отжига с матричной ДНК. Более высокий уровень содержания GC указывает на относительно более высокую температуру плавления.
Многие технологии секвенирования, такие как секвенирование Illumina , не позволяют считывать последовательности с высоким содержанием GC. Известно, что в геномах птиц много таких частей, что вызывает проблему «отсутствующих генов», которые, как ожидается, будут присутствовать в результате эволюции и фенотипа, но никогда не были секвенированы — до тех пор, пока не были использованы улучшенные методы. [26]
Систематика
[ редактировать ]Проблема видов в неэукариотической таксономии привела к различным предложениям по классификации бактерий, а специальный комитет по согласованию подходов к бактериальной систематике в 1987 году рекомендовал использовать GC-отношения в иерархической классификации более высокого уровня. [27] Например, Actinomycetota характеризуются как « бактерии с высоким содержанием GC ». [28] У Streptomyces coelicolor A3(2) содержание GC составляет 72%. [29] С использованием более надежных современных методов молекулярной систематики определение содержания Actinomycetota по содержанию GC было отменено и бактерии этой клады с низким содержанием GC. были обнаружены [30]
Программные инструменты
[ редактировать ]GCВидыСортер [31] и ТопСорт [32] представляют собой программные инструменты для классификации видов на основе их GC-содержания.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Определение GC - контент на CancerWeb Университета Ньюкасла , Великобритания.
- ^ Яковчук П., Протозанова Е., Франк-Каменецкий М.Д. (2006). «Вклад укладки оснований и спаривания оснований в термическую стабильность двойной спирали ДНК» . Нуклеиновые кислоты Рез . 34 (2): 564–74. дои : 10.1093/nar/gkj454 . ПМЦ 1360284 . ПМИД 16449200 .
- ^ Левин Р.Э., Ван Сикл С. (1976). «Аутолиз изолятов Pseudomonas putrefaciens с высоким содержанием GC». Антони ван Левенгук . 42 (1–2): 145–55. дои : 10.1007/BF00399459 . ПМИД 7999 . S2CID 9960732 .
- ^ Перейти обратно: а б Херст Л.Д., Торговец AR (март 2001 г.). «Высокое содержание гуанина-цитозина не является адаптацией к высокой температуре: сравнительный анализ среди прокариот» . Учеб. Биол. Наука . 268 (1466): 493–7. дои : 10.1098/rspb.2000.1397 . ПМЦ 1088632 . ПМИД 11296861 .
- ^ Галтье, Н.; Лобри, младший (1997). «Связь между содержанием G+C в геноме, вторичными структурами РНК и оптимальной температурой роста у прокариот». Журнал молекулярной эволюции . 44 (6): 632–636. Бибкод : 1997JMolE..44..632G . дои : 10.1007/PL00006186 . ПМИД 9169555 . S2CID 19054315 .
- ^ Яковчук, Петр; Протозанова Екатерина; Франк-Каменецкий, Максим Д. (2006). «Вклад укладки оснований и спаривания оснований в термическую стабильность двойной спирали ДНК» . Исследования нуклеиновых кислот . 34 (2): 564–574. дои : 10.1093/nar/gkj454 . ISSN 0305-1048 . ПМЦ 1360284 . ПМИД 16449200 .
- ^ Мэдиган, штат Монтана. и Мартинко Ю.М. (2003). Брока биология микроорганизмов (10-е изд.). Пирсон-Прентис Холл. ISBN 978-84-205-3679-8 .
- ^ «Определение коэффициента GC в Северо-Западном университете, Иллинойс, США» . Архивировано из оригинала 20 июня 2010 года . Проверено 11 июня 2007 г.
- ^ Вильгельм Дж., Пингуд А., Хан М. (май 2003 г.). «Метод оценки размеров генома на основе ПЦР в реальном времени» . Нуклеиновые кислоты Рез . 31 (10): е56. дои : 10.1093/нар/gng056 . ПМК 156059 . ПМИД 12736322 .
- ^ Виноградов А.Е. (май 1994 г.). «Измерение с помощью проточной цитометрии геномного соотношения AT/GC и размера генома» . Цитометрия . 16 (1): 34–40. дои : 10.1002/cyto.990160106 . ПМИД 7518377 .
- ^ Бернарди Дж. (январь 2000 г.). «Изохоры и эволюционная геномика позвоночных». Джин . 241 (1): 3–17. дои : 10.1016/S0378-1119(99)00485-0 . ПМИД 10607893 .
- ^ Фьюри Т.С., Хаусслер Д. (май 2003 г.). «Интеграция цитогенетической карты с проектом последовательности генома человека» . Хм. Мол. Жене . 12 (9): 1037–44. дои : 10.1093/hmg/ddg113 . ПМИД 12700172 .
- ^ Самнер А.Т., де ла Торре Дж., Ступпия Л. (август 1993 г.). «Распределение генов по хромосомам: цитологический подход». Дж. Мол. Эвол . 37 (2): 117–22. Бибкод : 1993JMolE..37..117S . дои : 10.1007/BF02407346 . ПМИД 8411200 . S2CID 24677431 .
- ^ Айссани Б., Бернарди Дж. (октябрь 1991 г.). «CpG-островки, гены и изохоры в геномах позвоночных». Джин . 106 (2): 185–95. дои : 10.1016/0378-1119(91)90198-К . ПМИД 1937049 .
- ^ Ромигье Ж, Ру С (2017). «Аналитические предубеждения, связанные с содержанием GC в молекулярной эволюции» . Фронт Генет . 8 : 16. дои : 10.3389/fgene.2017.00016 . ПМК 5309256 . ПМИД 28261263 .
- ^ Поццоли У., Меноцци Г., Фумагалли М. и др. (2008). «Как селективные, так и нейтральные процессы стимулируют эволюцию содержания GC в геноме человека» . БМК Эвол. Биол . 8 (1): 99. Бибкод : 2008BMCEE...8...99P . дои : 10.1186/1471-2148-8-99 . ПМК 2292697 . ПМИД 18371205 .
- ^ Вуйчик Дж.Д., Каррер К.М. (1999). «Анализ геномного содержания G + C, использования кодонов, контекста инициаторных кодонов и сайтов терминации трансляции у Tetrahymena thermophila ». Дж. Эукариот. Микробиол . 46 (3): 239–47. дои : 10.1111/j.1550-7408.1999.tb05120.x . ПМИД 10377985 . S2CID 28836138 .
- ^ Перейти обратно: а б Ромигье, Джонатан; Ранвез, Винсент; Дузери, Эммануэль Дж. П.; Галтье, Николя (1 августа 2010 г.). «Сопоставление динамики содержания GC в 33 геномах млекопитающих: связь с особенностями жизненного цикла и размерами хромосом» . Геномные исследования . 20 (8): 1001–1009. дои : 10.1101/гр.104372.109 . ISSN 1088-9051 . ПМЦ 2909565 . ПМИД 20530252 .
- ^ Бердселл, Дж. А. (1 июля 2002 г.). «Интеграция геномики, биоинформатики и классической генетики для изучения влияния рекомбинации на эволюцию генома» . Мол. Биол. Эвол . 19 (7): 1181–97. CiteSeerX 10.1.1.337.1535 . doi : 10.1093/oxfordjournals.molbev.a004176 . ПМИД 12082137 .
- ^ Международный консорциум по секвенированию генома человека (февраль 2001 г.). «Первичное секвенирование и анализ генома человека» . Природа . 409 (6822): 860–921. Бибкод : 2001Natur.409..860L . дои : 10.1038/35057062 . hdl : 2027.42/62798 . ПМИД 11237011 . (стр. 876)
- ^ Данные всего генома Saccharomyces cerevisiae в NCBI.
- ^ Данные всего генома Arabidopsis thaliana в NCBI.
- ^ Данные всего генома Plasmodium falciparum на NCBI.
- ^ Мусто Х., Каччо С., Родригес-Маседа Х., Бернарди Г. (1997). «Композиционные ограничения в чрезвычайно бедном GC геноме Plasmodium falciparum » (PDF) . Память Инст. Освальдо Круз . 92 (6): 835–41. дои : 10.1590/S0074-02761997000600020 . ПМИД 9566216 .
- ^ Дюре Л., Галтье Н. (2009). «Предвзятая конверсия генов и эволюция геномных ландшафтов млекопитающих». Анну Рев Геном Хум Генет . 10 : 285–311. doi : 10.1146/annurev-genom-082908-150001 . ПМИД 19630562 . S2CID 9126286 .
- ^ Хаттенер Р., Торрес Л., Вельд Т.И. и др. (2021). «Участки, устойчивые к секвенированию в геномах птиц, являются горячими точками для ускоренной эволюции белков» . БМК Эколь Эвол . 21 (176): 176. дои : 10.1186/s12862-021-01905-7 . ПМЦ 8449477 . ПМИД 34537008 .
- ^ Уэйн Л.Г.; и др. (1987). «Отчет специальной комиссии по согласованию подходов к бактериальной систематике» . Международный журнал систематической бактериологии . 37 (4): 463–4. дои : 10.1099/00207713-37-4-463 .
- ^ Браузер таксономии в NCBI
- ^ Данные всего генома Streptomyces coelicolor A3 (2) в NCBI.
- ^ Гай Р., МакМахон К.Д., Родригес-Валера Ф (2012). «Нарушение парадигмы: космополитические и многочисленные пресноводные актинобактерии имеют низкий GC». Отчеты по экологической микробиологии . 4 (1): 29–35. Бибкод : 2012EnvMR...4...29G . дои : 10.1111/j.1758-2229.2011.00274.x . ПМИД 23757226 .
- ^ Карими К., Вуитчик Д., Олдах М., Визе П. (2018). «Различение видов с использованием содержания GC в смешанных последовательностях ДНК или РНК» . Эвол Биоинформ Онлайн . 14 (1 января 2018 г.): 1176934318788866. doi : 10.1177/1176934318788866 . ПМК 6052495 . ПМИД 30038485 .
- ^ Ленерт Э., Мушка М., Буррески М., Галло Н., Шварц Дж., Прингл Дж. (2014). «Обширные различия в экспрессии генов между симбиотическими и апосимбиотическими книдариями» . G3 (Бетесда) . 4 (2): 277–95. дои : 10.1534/g3.113.009084 . ПМЦ 3931562 . ПМИД 24368779 .