Jump to content

Обозначение нуклеиновой кислоты

Международным союзом Используемая в настоящее время система обозначений нуклеиновых кислот была впервые формализована теоретической и прикладной химии (IUPAC) в 1970 году. [1] В этом общепринятом обозначении используются римские символы G, C, A и T для обозначения четырех нуклеотидов, обычно встречающихся в дезоксирибонуклеиновых кислотах (ДНК).

Учитывая быстро растущую роль генетического секвенирования, синтеза и анализа в биологии, некоторые исследователи разработали альтернативные обозначения для дальнейшей поддержки анализа и манипулирования генетическими данными. Эти обозначения обычно используют размер, форму и симметрию для достижения этих целей.

Обозначение ИЮПАК

[ редактировать ]
ИЮПАК Вырожденные базовые символы [2]
Описание Символ Представленные базы Дополнительный
базы
Нет. А С Г Т
Аденин А 1 А Т
Цитозин С С Г
Гуанин Г Г С
Тимин Т Т А
Урацил В В А
Слабый В 2 А Т В
Сильный С С Г С
Амино М А С К
Кетон К Г Т М
Пуриновый Р А Г И
Пиримидин И С Т Р
Не А Б 3 С Г Т V
Не С Д А Г Т ЧАС
Не Г ЧАС А С Т Д
Не Т [а] V А С Г Б
Любая одна база Н 4 А С Г Т Н
Зазор - 0 -
  1. ^ Не U для РНК

Вырожденные базовые символы в биохимии - это ИЮПАК. [2] [3] представление позиции в последовательности ДНК , которая может иметь несколько возможных альтернатив. Их не следует путать с неканоническими основаниями , поскольку каждая конкретная последовательность фактически будет иметь одно из правильных оснований. Они используются для кодирования консенсусной последовательности популяции выровненных последовательностей и используются, например, в филогенетическом анализе для суммирования в одну множественную последовательность или для поиска BLAST , даже если вырожденные символы IUPAC замаскированы (поскольку они не закодированы).

В общепринятой системе ИЮПАК азотистые основания обозначаются первыми буквами их химических названий: гуанин, цитозин, аденин и тимин. [1] Это сокращение также включает одиннадцать «неоднозначных» символов, связанных со всеми возможными комбинациями четырех оснований ДНК. [4] Символы неоднозначности были разработаны для кодирования позиционных изменений, чтобы сообщать об ошибках секвенирования ДНК , консенсусных последовательностях или однонуклеотидных полиморфизмах . Обозначения ИЮПАК, включая символы неоднозначности и предлагаемые мнемоники, показаны в таблице 1.

Несмотря на широкое и почти универсальное признание, система ИЮПАК имеет ряд ограничений, связанных с ее использованием латинского алфавита. Плохая разборчивость латинских символов в верхнем регистре, которые обычно используются при отображении генетических данных, может быть главным среди этих ограничений. Значение внешних проекций для различения букв хорошо документировано. [5] Однако эти выступы отсутствуют в заглавных буквах, которые в некоторых случаях различимы только по тонким внутренним признакам. Возьмем, к примеру, заглавные буквы C и G, используемые для обозначения цитозина и гуанина. Эти символы обычно составляют половину символов генетической последовательности, но отличаются небольшой внутренней галочкой (в зависимости от гарнитуры). Тем не менее, эти латинские символы доступны в наборе символов ASCII , наиболее часто используемом в текстовых сообщениях, что усиливает повсеместное распространение этой системы.

Другой недостаток нотации ИЮПАК возникает из-за того, что ее одиннадцать символов неоднозначности были выбраны из остальных символов латинского алфавита. Авторы обозначений постарались выделить символы неоднозначности с логической мнемоникой. Например, S используется для обозначения возможности обнаружения цитозина или гуанина в генетических локусах, оба из которых образуют сильные межцепочечные связывающие взаимодействия. И наоборот, более слабые взаимодействия тимина и аденина обозначаются буквой W. Однако удобная мнемоника не так легко доступна для других символов неоднозначности, представленных в таблице 1. Это затрудняет использование символов неоднозначности и может объяснить их ограниченное применение.

Номенклатура нуклеиновых кислот

[ редактировать ]
Пронумерованы атомы углерода рибозы на цитидине .

Положения атомов углерода в рибозном сахаре, который образует основу цепи нуклеиновой кислоты, пронумерованы и используются для обозначения направления нуклеиновых кислот (5'->3' против 3'->5'). Это называется направленностью . [3]

Альтернативные визуально улучшенные обозначения

[ редактировать ]

Проблемы разборчивости, связанные с генетическими данными, закодированными в ИЮПАК, побудили биологов рассмотреть альтернативные стратегии отображения генетических данных. Эти творческие подходы к визуализации последовательностей ДНК обычно основывались на использовании пространственно распределенных символов и/или визуально различных форм для кодирования длинных последовательностей нуклеиновых кислот. Были предприняты попытки использовать альтернативные обозначения нуклеотидных последовательностей, однако общее распространение было низким. Некоторые из этих подходов кратко изложены ниже.

Проекция нотоносца

[ редактировать ]
Stave Projection использует пространственно распределенные точки для улучшения разборчивости последовательностей ДНК .

В 1986 году Ковин и др. описал новый метод визуализации последовательности ДНК, известный как Stave Projection. [6] Их стратегия заключалась в том, чтобы закодировать нуклеотиды в виде кругов на горизонтальных полосах, похожих на ноты на нотном стане. Как показано на рисунке 1, каждый пробел на пятилинейном посохе соответствовал одному из четырех оснований ДНК. Пространственное распределение кругов значительно облегчило различение отдельных оснований и сравнение генетических последовательностей, чем данные, закодированные в ИЮПАК.

Порядок оснований (сверху вниз, G, A, T, C) выбирается таким, чтобы комплементарную цепь можно было прочитать, перевернув проекцию вверх ногами.

Геометрические символы

[ редактировать ]

Циммерман и др. применили другой подход к визуализации генетических данных. [7] Вместо того, чтобы полагаться на пространственно распределенные круги для выделения генетических особенностей, они использовали четыре геометрически разнообразных символа, найденных в стандартном компьютерном шрифте, чтобы различать четыре основы. Авторы разработали простой макрос WordPerfect для перевода символов IUPAC в более визуально различимые символы.

ДНК Скайлайн

[ редактировать ]

С ростом доступности редакторов шрифтов Джарвиус и Ландегрен разработали новый набор генетических символов, известный как шрифт DNA Skyline, в котором для представления различных оснований ДНК используются все более высокие блоки. [8] Несмотря на то, что шрифт DNA Skyline напоминает пространственно распределенную проекцию Stave Projection Ковина и др ., его легко загрузить, и он позволяет осуществлять перевод в нотацию IUPAC и обратно путем простого изменения шрифта в большинстве стандартных текстовых редакторов.

Амбиграфические обозначения

[ редактировать ]
AmbiScript использует амбиграммы для отражения симметрии ДНК и поддержки манипуляций и анализа генетических данных.

Амбиграммы (символы, которые передают разное значение, если смотреть в разной ориентации) были разработаны для отражения структурной симметрии, обнаруженной в двойной спирали ДНК. [9] Присвоив амбиграфические символы комплементарным основаниям (например, гуанин: b, цитозин: q, аденин: n и тимин: u), можно дополнить последовательности ДНК, просто повернув текст на 180 градусов. [10] Амбиграфическая нотация нуклеиновой кислоты также позволяет легко идентифицировать генетические палиндромы, такие как сайты рестрикции эндонуклеаз, как фрагменты текста, которые можно поворачивать на 180 градусов без изменения последовательности.

Одним из примеров амбиграфической нотации нуклеиновых кислот является AmbiScript, рационально разработанная нотация нуклеиновых кислот, сочетающая в себе многие визуальные и функциональные особенности своих предшественников. [11] В его обозначениях также используются символы пространственного смещения, чтобы облегчить визуальный просмотр и анализ генетических данных. AmbiScript также был разработан для обозначения неоднозначных положений нуклеотидов с помощью составных символов. Эта стратегия была направлена ​​на то, чтобы предложить более интуитивное решение проблемы использования символов неоднозначности, впервые предложенное ИЮПАК. [4] Как и шрифты DNA Skyline Джарвиуса и Ландегрена, шрифты AmbiScript можно загрузить и применить к данным последовательностей, закодированных в формате IUPAC.

Сопряжение оснований тройной спирали

[ редактировать ]

Пары оснований Уотсона и Крика обозначаются знаком «•», «-» или «.» (пример: A•T или поли(rC)•2поли(rC)).

Хугстина Пары оснований тройной спирали обозначаются знаком «*» или «:» (пример: C•G*G+, или T•A*T, или C•G*G, или T•A*A).

См. также

[ редактировать ]
  1. ^ Перейти обратно: а б Комиссия IUPAC-IUB по биохимической номенклатуре (1970). «Сокращения и символы нуклеиновых кислот, полинуклеотидов и их компонентов». Биохимия . 9 (20): 4022–4027. дои : 10.1021/bi00822a023 .
  2. ^ Перейти обратно: а б Номенклатурный комитет Международного биохимического союза (NC-IUB) (1984). «Номенклатура не полностью определенных оснований в последовательностях нуклеиновых кислот» . Исследования нуклеиновых кислот . 13 (9): 3021–3030. дои : 10.1093/нар/13.9.3021 . ПМК   341218 . ПМИД   2582368 .
  3. ^ Перейти обратно: а б Корниш-Боуден А (май 1985 г.). «Номенклатура не полностью определенных оснований в последовательностях нуклеиновых кислот: рекомендации 1984 г.» . Исследования нуклеиновых кислот . 13 (9): 3021–30. дои : 10.1093/нар/13.9.3021 . ПМК   341218 . ПМИД   2582368 .
  4. ^ Перейти обратно: а б Номенклатурный комитет Международного союза биохимии (NC-IUB) (1986). «Номенклатура не полностью определенных оснований в последовательностях нуклеиновых кислот. Рекомендации 1984 г.» . Учеб. Натл. акад. наук. США . 83 (1): 4–8. Бибкод : 1986PNAS...83....4O . дои : 10.1073/pnas.83.1.4 . ПМК   322779 . ПМИД   2417239 .
  5. ^ Тинкер, Массачусетс, 1963. Разборчивость печати. Издательство Университета штата Айова, Эймс, Айова.
  6. ^ Коуин, Дж. Э.; Джеллис, Швейцария; Риквуд, Д. (1986). «Новый метод представления последовательностей ДНК, сочетающий в себе простоту визуального анализа с машиночитаемостью» . Исследования нуклеиновых кислот . 14 (1): 509–15. дои : 10.1093/нар/14.1.509 . ПМК   339435 . ПМИД   3003680 .
  7. ^ Циммерман, Пенсильвания; Заклинание, ML; Ролз, Дж.; Уннаш, ТР (1991). «Преобразование данных последовательности ДНК в геометрические символы». БиоТехники . 11 (1): 50–52. ПМИД   1954017 .
  8. ^ Джарвиус, Дж.; Ландегрен, У. (2006). «DNA Skyline: шрифты для облегчения визуального контроля последовательностей нуклеиновых кислот» . БиоТехники . 40 (6): 740. дои : 10.2144/000112180 . ПМИД   16774117 .
  9. ^ Хофштадтер, Дуглас Р. (1985). Метамагические темы: подвергая сомнению сущность разума и закономерностей . Нью-Йорк: Основные книги. ISBN  978-0465045662 .
  10. ^ Розак, Д.А. (2006). «Практические и педагогические преимущества амбиграфической записи нуклеиновых кислот». Нуклеозиды, нуклеотиды и нуклеиновые кислоты . 25 (7): 807–813. дои : 10.1080/15257770600726109 . ПМИД   16898419 . S2CID   23600737 .
  11. ^ Розак, Дэвид А.; Розак, Энтони Дж. (2008). «Простота, функциональность и разборчивость в расширенной амбиграфической записи нуклеиновых кислот» . БиоТехники . 44 (6): 811–813. дои : 10.2144/000112727 . ПМИД   18476835 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: ec337580a6c7903e8a8d1e3c552105e9__1702317900
URL1:https://arc.ask3.ru/arc/aa/ec/e9/ec337580a6c7903e8a8d1e3c552105e9.html
Заголовок, (Title) документа по адресу, URL1:
Nucleic acid notation - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)