Правила Чаргаффа

Правила Чаргаффа (данные Эрвином Чаргаффом ) гласят, что в ДНК любого вида и любого организма количество гуанина должно быть равно количеству цитозина , а количество аденина должно быть равно количеству тимина . оснований 1:1 Кроме того, стехиометрическое соотношение пуриновых и пиримидиновых (т.е. A+G=T+C
) должно существовать. Этот паттерн обнаружен в обеих цепях ДНК. Их открыл химик австрийского происхождения Эрвин Чаргафф. [ 1 ] [ 2 ] в конце 1940-х годов.
Определения
[ редактировать ]Первое правило четности
[ редактировать ]Первое правило гласит, что двухцепочечная ДНК молекула в целом имеет процентное равенство пар оснований: A% = T% и G% = C%. Строгая проверка этого правила составляет основу пар оснований Уотсона-Крика в модели двойной спирали ДНК.
Второе правило четности
[ редактировать ]Второе правило гласит, что как Α% ≈ Τ%, так и G% ≈ C% действительны для каждой из двух цепей ДНК. [ 3 ] Это описывает лишь глобальную особенность состава оснований в одной цепи ДНК. [ 4 ]
Исследовать
[ редактировать ]Второе правило четности было открыто в 1968 году. [ 3 ] В нем говорится, что в одноцепочечной ДНК количество адениновых единиц примерно равно количеству тимина (%A ≈ %T), а количество цитозиновых единиц примерно равно количеству гуанина (%C ≈ %G). .
Первое эмпирическое обобщение второго правила четности Чаргаффа, названное принципом симметрии, было предложено Винаякумаром В. Прабху. [ 5 ] в 1993 году. Этот принцип гласит, что для любого данного олигонуклеотида его частота примерно равна частоте его комплементарного обратного олигонуклеотида. Теоретическое обобщение [ 6 ] был математически выведен Мишелем Э.Б. Ямагиши и Роберто Х. Хераи в 2011 году. [ 7 ]
В 2006 году было показано, что это правило распространяется на четыре [ 2 ] из пяти типов двухцепочечных геномов; в частности, это относится к эукариотическим хромосомам , бактериальным хромосомам, вирусным геномам с двухцепочечной ДНК и хромосомам архей . [ 8 ] Это не применимо к органеллярным геномам ( митохондриям и пластидам ) размером менее ~ 20-30 т.п.н. , а также к геномам одноцепочечной ДНК (вирусным) или любому типу генома РНК . Основания для этого правила все еще изучаются, хотя размер генома может играть роль.

Само правило имеет последствия. В большинстве бактериальных геномов (которые обычно на 80–90%) кодируют гены, расположенные таким образом, что примерно 50% кодирующей последовательности лежит на каждой цепи. Вацлав Шибальский в 1960-х годах показал, что в бактериофагов кодирующих последовательностях пурины (A и G) превышают пиримидины (C и T). [ 9 ] Это правило с тех пор было подтверждено и на других организмах, и теперь его, вероятно, следует назвать « правилом Шибальского ». Хотя правило Шибальского в целом справедливо, известны исключения. [ 10 ] [ 11 ] [ 12 ] Биологическая основа правления Шибальского пока неизвестна.
Совместный эффект второго правила Чаргаффа и правила Шибальского можно увидеть в бактериальных геномах, где кодирующие последовательности распределены неравномерно. Генетический код состоит из 64 кодонов , из которых 3 функционируют как терминирующие кодоны: в норме в белках присутствует только 20 аминокислот . (Есть две необычные аминокислоты — селеноцистеин и пирролизин — обнаруженные в ограниченном числе белков и кодируемые стоп-кодонами — TGA и TAG соответственно.) Несовпадение между количеством кодонов и аминокислот позволяет нескольким кодонам кодировать один и тот же кодон. аминокислота — такие кодоны обычно различаются только по третьему положению основания кодона.
Многомерный статистический анализ использования кодонов в геномах с неравным количеством кодирующих последовательностей на двух цепях показал, что использование кодонов в третьей позиции зависит от цепи, на которой расположен ген. Вероятно, это результат правил Шибальского и Чаргаффа. Из-за асимметрии использования пиримидина и пурина в кодирующих последовательностях цепь с большим содержанием кодирования будет иметь тенденцию иметь большее количество пуриновых оснований (правило Шибальского). Поскольку количество пуриновых оснований в очень хорошем приближении будет равно числу их комплементарных пиримидинов в одной и той же цепи, а поскольку кодирующие последовательности занимают 80–90% цепи, по-видимому, существует (1) селективное давление на третьем основании, чтобы минимизировать количество пуриновых оснований в цепи с большим содержанием кодирования; и (2) что это давление пропорционально несоответствию длины кодирующих последовательностей между двумя цепями.

Высказано предположение, что возникновение отклонения от правила Чаргаффа в органеллах является следствием механизма репликации. [ 13 ] Во время репликации нити ДНК расходятся. В одноцепочечной ДНК цитозин спонтанно медленно дезаминируется до аденозина C в A ( трансверсия ). Чем длиннее нити разделены, тем больше количество дезаминирования. По причинам, которые пока не ясны, нити имеют тенденцию существовать дольше в одиночной форме в митохондриях, чем в хромосомной ДНК. Этот процесс имеет тенденцию давать одну цепь, обогащенную гуанином (G) и тимином (T), с ее комплементом, обогащенным цитозином (C) и аденозином (A), и этот процесс мог привести к отклонениям, обнаруженным в митохондриях. [ нужна ссылка ] [ сомнительно – обсудить ]
Второе правило Чаргаффа, по-видимому, является следствием более сложного правила четности: в одной цепи ДНК любой олигонуклеотид ( к-мер или n-грамм ; длина ≤ 10) присутствует в равных количествах со своим обратным комплементарным нуклеотидом. Из-за вычислительных требований это не было проверено во всех геномах для всех олигонуклеотидов. Это было проверено для триплетных олигонуклеотидов на большом наборе данных. [ 14 ] Альбрехт-Бюлер предположил, что это правило является следствием эволюции геномов в процессе инверсии и транспозиции . [ 14 ] Этот процесс, по-видимому, не затронул митохондриальные геномы. Второе правило четности Чаргаффа, по-видимому, распространяется с уровня нуклеотидов на популяции триплетов кодонов в случае цельной одноцепочечной ДНК человеческого генома. [ 15 ] Своего рода «второе правило четности Чаргаффа на уровне кодонов» предлагается следующим образом:
Первый кодон | Второй кодон | Предлагаемая связь | Подробности |
---|---|---|---|
Twx (1-я базовая позиция — T) |
yzA (3-я базовая позиция — А) |
% Twx % yzA |
Twx и yzA являются зеркальными кодонами, например TCG и CGA
|
Cwx (1-я базовая позиция — C) |
yzG (3-я базовая позиция — G) |
% Cwx % yzG |
Cwx и yzG являются зеркальными кодонами, например CTA и TAG
|
wTx (2-я базовая позиция — T) |
yAz (2-я базовая позиция — А) |
% wTx % yAz |
wTx и yAz являются зеркальными кодонами, например CTG и CAG
|
wCx (2-я базовая позиция — C) |
yGz (2-я базовая позиция — G) |
% wCx % yGz |
wCx и yGz являются зеркальными кодонами, например TCT и AGA
|
wxT (3-я базовая позиция — Т) |
Ayz (1-я базовая позиция — A) |
% wxT % Ayz |
wxT и Ayz являются зеркальными кодонами, например CTT и AAG
|
wxC (3-я базовая позиция — C) |
Gyz (1-я базовая позиция — G) |
% wxC % Gyz |
wxC и Gyz являются зеркальными кодонами, например GGC и GCC
|
Примеры: вычисление всего генома человека с использованием первой рамки считывания кодонов обеспечивает:
36530115 TTT and 36381293 AAA (ratio % = 1.00409). 2087242 TCG and 2085226 CGA (ratio % = 1.00096), etc...
В 2020 году высказано предположение, что физические свойства дцДНК (двухцепочечная ДНК) и тенденция к максимальной энтропии всех физических систем являются причиной второго правила четности Чаргаффа. [ 16 ] Симметрии и закономерности, присутствующие в последовательностях дцДНК, могут возникать только из физических особенностей молекулы дцДНК и принципа максимальной энтропии, а не из-за биологического или экологического эволюционного давления.
Процент оснований в ДНК
[ редактировать ]Следующая таблица представляет собой репрезентативную выборку данных Эрвина Чаргаффа за 1952 год, в которой указан базовый состав ДНК различных организмов и подтверждается оба правила Чаргаффа. [ 17 ] Такой организм, как φX174, со значительным отклонением от A/T и G/C, равным единице, указывает на одноцепочечную ДНК.
Организм | Таксон | %А | %G | %С | %Т | В | Г/К | %GC | %В |
---|---|---|---|---|---|---|---|---|---|
кукуруза | Зеа | 26.8 | 22.8 | 23.2 | 27.2 | 0.99 | 0.98 | 46.1 | 54.0 |
Осьминог | Осьминог | 33.2 | 17.6 | 17.6 | 31.6 | 1.05 | 1.00 | 35.2 | 64.8 |
Курица | Галл | 28.0 | 22.0 | 21.6 | 28.4 | 0.99 | 1.02 | 43.7 | 56.4 |
Крыса | Раттус | 28.6 | 21.4 | 20.5 | 28.4 | 1.01 | 1.00 | 42.9 | 57.0 |
Человек | гомо | 29.3 | 20.7 | 20.0 | 30.0 | 0.98 | 1.04 | 40.7 | 59.3 |
Кузнечик | Прямокрылые | 29.3 | 20.5 | 20.7 | 29.3 | 1.00 | 0.99 | 41.2 | 58.6 |
Морской еж | Эхинодея | 32.8 | 17.7 | 17.3 | 32.1 | 1.02 | 1.02 | 35.0 | 64.9 |
Пшеница | Тритикум | 27.3 | 22.7 | 22.8 | 27.1 | 1.01 | 1.00 | 45.5 | 54.4 |
Дрожжи | Сахаромицеты | 31.3 | 18.7 | 17.1 | 32.9 | 0.95 | 1.09 | 35.8 | 64.4 |
кишечная палочка | Эшерихия | 24.7 | 26.0 | 25.7 | 23.6 | 1.05 | 1.01 | 51.7 | 48.3 |
φX174 | ФиХ174 | 24.0 | 23.3 | 21.5 | 31.2 | 0.77 | 1.08 | 44.8 | 55.2 |
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Элсон Д., Чаргафф Э. (1952). «О содержании дезоксирибонуклеиновой кислоты в гаметах морского ежа». Эксперименты . 8 (4): 143–145. дои : 10.1007/BF02170221 . ПМИД 14945441 . S2CID 36803326 .
- ^ Jump up to: а б Чаргафф Э., Липшиц Р., Грин С. (1952). «Состав дезоксипентозных нуклеиновых кислот четырех родов морских ежей» . J Биол Хим . 195 (1): 155–160. дои : 10.1016/S0021-9258(19)50884-5 . ПМИД 14938364 . S2CID 11358561 .
- ^ Jump up to: а б Руднер, Р; Каркас, доктор медицинских наук; Чаргафф, Э. (1968). «Разделение ДНК B. Subtilis на комплементарные цепи. 3. Прямой анализ» . Труды Национальной академии наук Соединенных Штатов Америки . 60 (3): 921–2. Бибкод : 1968PNAS...60..921R . дои : 10.1073/pnas.60.3.921 . ПМК 225140 . ПМИД 4970114 .
- ^ Чжан CT, Чжан Р, Оу HY (2003). «База данных Z-кривых: орафическое представление последовательностей генома» . Биоинформатика . 19 [выпуск=5 (5): 590–599. doi : 10.1093/биоинформатика/btg041 . ПМИД 12651717 .
- ^ Прабху В.В. (1993). «Наблюдение симметрии в длинных нуклеотидных последовательностях» . Исследования нуклеиновых кислот . 21 (12): 2797–2800. дои : 10.1093/нар/21.12.2797 . ПМК 309655 . ПМИД 8332488 .
- ^ Ямагиси МЭБ (2017). Математическая грамматика биологии . SpringerBriefs по математике. Спрингер. arXiv : 1112.1528 . дои : 10.1007/978-3-319-62689-5 . ISBN 978-3-319-62688-8 . S2CID 16742066 .
- ^ Ямагиши М.Э., Хераи Р.Х. (2011). «Грамматика биологии» Чаргаффа: новые фрактальные правила . SpringerBriefs по математике. arXiv : 1112.1528 . дои : 10.1007/978-3-319-62689-5 . ISBN 978-3-319-62688-8 . S2CID 16742066 .
- ^ Митчелл Д., Бридж Р. (2006). «Проверка второго правила Чаргаффа». Биохимия Биофиз Рес Коммьюнити . 340 (1): 90–94. дои : 10.1016/j.bbrc.2005.11.160 . ПМИД 16364245 .
- ^ Шибальски В., Кубински Х., Шелдрик О. (1966). «Пиримидиновые кластеры на транскрипционной цепи ДНК и их возможная роль в инициации синтеза РНК». Холодный источник Harb Symp Quant Biol . 31 : 123–127. дои : 10.1101/SQB.1966.031.01.019 . ПМИД 4966069 .
- ^ Кристилло А.Д. (1998). Характеристика генов переключения G0/G1 в культивируемых Т-лимфоцитах . Кингстон, Онтарио, Канада: Королевский университет.
- ^ Белл С.Дж., Форсдайк Д.Р. (1999). «Отклонения от второго правила четности Чаргаффа коррелируют с направлением транскрипции». J Теория Биол . 197 (1): 63–76. Бибкод : 1999JThBi.197...63B . дои : 10.1006/jtbi.1998.0858 . ПМИД 10036208 .
- ^ Лао П.Дж., Форсдайк Д.Р. (2000). «Термофильные бактерии строго подчиняются правилу направления транскрипции Шибальского и вежливо загружают РНК пуринами как аденином, так и гуанином» . Геномные исследования . 10 (2): 228–236. дои : 10.1101/гр.10.2.228 . ПМК 310832 . ПМИД 10673280 .
- ^ Николау С., Альмирантис Ю. (2006). «Отклонения от второго правила четности Чаргаффа в органеллярной ДНК. Взгляд на эволюцию органелларных геномов». Джин . 381 : 34–41. дои : 10.1016/j.gene.2006.06.010 . ПМИД 16893615 .
- ^ Jump up to: а б Альбрехт-Бюлер Г (2006). «Асимптотически возрастающее соответствие геномов второму правилу четности Чаргаффа посредством инверсий и инвертированных транспозиций» . Proc Natl Acad Sci США . 103 (47): 17828–17833. Бибкод : 2006PNAS..10317828A . дои : 10.1073/pnas.0605553103 . ПМЦ 1635160 . ПМИД 17093051 .
- ^ Перес, Ж.-К. (сентябрь 2010 г.). «Популяции кодонов в одноцепочечной цельной ДНК человеческого генома фрактальны и точно настроены по золотому сечению 1,618». Междисциплинарные науки: Вычислительные науки о жизни . 2 (3): 228–240. дои : 10.1007/s12539-010-0022-0 . ПМИД 20658335 . S2CID 54565279 .
- ^ Пьеро Фариселл, Кристиан Таччоли, Лука Пагани и Амос Маритан (апрель 2020 г.). «Симметрия последовательностей ДНК вследствие случайности: происхождение второго правила четности Чаргаффа» . Брифинги по биоинформатике . 22 (весна04): 2172–2181. дои : 10.1093/bib/bb041 . ПМЦ 7986665 . ПМИД 32266404 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Бансал М (2003). «Структура ДНК: новый взгляд на двойную спираль Уотсона-Крика» (PDF) . Современная наука . 85 (11): 1556–1563. Архивировано из оригинала (PDF) 26 июля 2014 г. Проверено 26 июля 2013 г.
Дальнейшее чтение
[ редактировать ]- Шибальски В., Кубински Х., Шелдрик П. (1966). «Пиримидиновые кластеры на транскрибирующих цепях ДНК и их возможная роль в инициации синтеза РНК». Симпозиумы Колд-Спринг-Харбор по количественной биологии . 31 : 123–127. дои : 10.1101/SQB.1966.031.01.019 . ПМИД 4966069 .
- Лобри-младший (1996). «Асимметричные замены в двух цепях ДНК бактерий» . Мол. Биол. Эвол . 13 (5): 660–665. doi : 10.1093/oxfordjournals.molbev.a025626 . ПМИД 8676740 .
- Лафей Б., Ллойд А.Т., Маклин М.Дж., Дивайн К.М., Шарп П.М., Вулф К.Х. (1999). «Состав протеома и использование кодонов у спирохет: мутационные предубеждения, специфичные для вида и цепи ДНК» . Нуклеиновые кислоты Рез . 27 (7): 1642–1649. дои : 10.1093/нар/27.7.1642 . ПМК 148367 . ПМИД 10075995 .
- Маклин М.Дж., Вулф К.Х., Дивайн К.М. (1998). «Ошибки в базовом составе, ориентация репликации и ориентация генов в 12 геномах прокариот». Джей Мол Эвол . 47 (6): 691–696. Бибкод : 1998JMolE..47..691M . CiteSeerX 10.1.1.28.9035 . дои : 10.1007/PL00006428 . ПМИД 9847411 . S2CID 12917481 .
- Макинерни Дж.О. (1998). «Репликационная и транскрипционная селекция использования кодонов у Borrelia burgdorferi» . Proc Natl Acad Sci США . 95 (18): 10698–10703. Бибкод : 1998PNAS...9510698M . дои : 10.1073/pnas.95.18.10698 . ПМК 27958 . ПМИД 9724767 .
Внешние ссылки
[ редактировать ]- База данных Атласа генома CBS, заархивированная 16 мая 2016 г. в Португальском веб-архиве, содержит сотни примеров искажения базы и возникновения проблем. [ 1 ]
- База данных геномов Z-кривых — инструмент трехмерной визуализации и анализа геномов. [ 2 ]
- ^ Халлин П.Ф., Дэвид Ассери Д. (2004). «База данных атласа генома CBS: динамическое хранилище биоинформатических результатов и данных последовательностей» . Биоинформатика . 20 (18): 3682–3686. doi : 10.1093/биоинформатика/bth423 . ПМИД 15256401 .
- ^ Чжан CT, Чжан Р, Оу HY (2003). «База данных Z-кривых: графическое представление последовательностей генома» . Биоинформатика . 19 (5): 593–599. doi : 10.1093/биоинформатика/btg041 . ПМИД 12651717 .