Открытая рамка чтения

В молекулярной биологии рамки считывания определяются как участки последовательности ДНК между стартовыми и стоп- кодонами . Обычно это рассматривают в пределах изучаемого участка последовательности ДНК прокариот , где только одна из шести возможных рамок считывания будет «открытой» («чтение», однако, относится к РНК, образующейся в результате транскрипции ДНК и ее последующей взаимодействие с рибосомой при трансляции ). Такая ORF может [ 1 ] содержат стартовый кодон (обычно AUG в терминах РНК ) и по определению не могут выходить за пределы стоп-кодона (обычно UAA, UAG или UGA в РНК). [ 2 ] Этот стартовый кодон (не обязательно первый) указывает, где может начаться трансляция. Сайт терминации транскрипции расположен после ORF, за стоп-кодоном трансляции. Если бы транскрипция прекратилась до появления стоп-кодона, неполный белок . во время трансляции образовался бы [ 3 ]
В эукариотических генах с несколькими экзонами мРНК интроны удаляются, а экзоны затем соединяются вместе после транскрипции, образуя окончательную для трансляции белка. Поэтому в контексте поиска генов старт-стоп определение ORF применимо только к сплайсированным мРНК , а не к геномной ДНК, поскольку интроны могут содержать стоп-кодоны и/или вызывать сдвиги между рамками считывания. Альтернативное определение гласит, что ORF — это последовательность, длина которой делится на три и ограничена стоп-кодонами. [ 1 ] [ 4 ] Это более общее определение может быть полезно в контексте транскриптомики и метагеномики , где стартовый или стоп-кодон может отсутствовать в полученных последовательностях. Такая ORF соответствует частям гена, а не целому гену.
Биологическое значение
[ редактировать ]Открытые рамки считывания (ORF) часто используются в качестве доказательства, помогающего прогнозировать гены . Длинные ORF часто используются наряду с другими данными для первоначальной идентификации -кандидатов, кодирующих белок областей , или функциональных областей, кодирующих РНК, в последовательности ДНК . [ 5 ] Наличие ORF не обязательно означает, что регион всегда переводится . Например, в случайно сгенерированной последовательности ДНК с равным процентом каждого нуклеотида стоп -кодон можно ожидать один раз на каждый 21 кодон . [ 5 ] Простой алгоритм прогнозирования генов прокариот может искать стартовый кодон, за которым следует открытая рамка считывания, достаточно длинная для кодирования типичного белка, где использование кодона в этой области соответствует частотной характеристике кодирующих областей данного организма. [ 5 ] Поэтому некоторые авторы говорят, что ORF должна иметь минимальную длину, например 100 кодонов. [ 6 ] или 150 кодонов. [ 5 ] Сама по себе даже длинная открытая рамка считывания не является убедительным доказательством присутствия гена . [ 5 ]
Короткие ORF (sORF)
[ редактировать ]Некоторые короткие ORF (sORF), также называемые Малыми открытыми рамками считывания , [ 7 ] обычно <100 кодонов в длину, [ 8 ] у которых отсутствуют классические признаки генов, кодирующих белки (как из нкРНК, так и из мРНК), могут производить функциональные пептиды. [ 9 ] Известно, что 5'-UTR около 50% мРНК млекопитающих содержат одну или несколько кОРС, [ 10 ] также называемые восходящими ORF или uORF . Однако менее 10% мРНК позвоночных, исследованных в более старом исследовании, содержали кодоны AUG перед основной ORF. Интересно, что uORF были обнаружены в двух третях протоонкогенов и родственных им белков. [ 11 ] 64–75% экспериментально обнаруженных сайтов инициации трансляции кОРС консервативны в геномах человека и мыши и могут указывать на наличие у этих элементов функции. [ 12 ] Однако кОРС часто можно обнаружить только в минорных формах мРНК и избежать отбора; Высокая консервативность сайтов инициации может быть связана с их расположением внутри промоторов соответствующих генов. Это характерно SLAMF1 . , например, для гена [ 13 ]
Шестикадровый перевод
[ редактировать ]Поскольку ДНК интерпретируется группами по три нуклеотида (кодона), цепь ДНК имеет три различные рамки считывания. [ 14 ] Двойная спираль молекулы ДНК имеет две антипараллельные цепи; поскольку две нити имеют по три рамки считывания каждая, существует шесть возможных трансляций кадров. [ 14 ]

Программное обеспечение
[ редактировать ]Искатель
[ редактировать ]ORF Finder (Поиск открытых рамок считывания) [ 15 ] представляет собой инструмент графического анализа, который находит все открытые рамки считывания выбранного минимального размера в последовательности пользователя или в последовательности, уже имеющейся в базе данных. Этот инструмент идентифицирует все открытые рамки считывания, используя стандартные или альтернативные генетические коды. Выведенная аминокислотная последовательность может быть сохранена в различных форматах и найдена в базе данных последовательностей с использованием сервера базового инструмента поиска локального выравнивания (BLAST). ORF Finder должен быть полезен при подготовке полных и точных заявок на последовательность. Он также поставляется с программным обеспечением для отправки последовательностей Sequin (анализатор последовательностей).
Следователь
[ редактировать ]Следователь ОРФ [ 16 ] это программа, которая не только дает информацию о кодирующих и некодирующих последовательностях, но также может выполнять попарное глобальное выравнивание последовательностей различных генов/областей ДНК. Инструмент эффективно находит ORF для соответствующих аминокислотных последовательностей, преобразует их в однобуквенный аминокислотный код и указывает их расположение в последовательности. Попарное глобальное выравнивание между последовательностями позволяет удобно обнаруживать различные мутации, включая полиморфизм одиночных нуклеотидов . алгоритмы Нидлмана-Вунша Для выравнивания генов используются . ORF Investigator написан на портативном Perl языке программирования и поэтому доступен пользователям всех распространенных операционных систем.
Предсказатель
[ редактировать ]Орфпредиктор [ 17 ] представляет собой веб-сервер, предназначенный для идентификации областей, кодирующих белок, в последовательностях, полученных с помощью экспрессируемой метки последовательности (EST). Для последовательностей запроса с попаданием в BLASTX программа прогнозирует области кодирования на основе кадров считывания трансляции, идентифицированных в выравниваниях BLASTX, в противном случае она прогнозирует наиболее вероятную область кодирования на основе внутренних сигналов последовательностей запроса. Выходными данными являются предсказанные пептидные последовательности в формате FASTA и строка определения, включающая идентификатор запроса, рамку считывания трансляции и положения нуклеотидов, где начинается и заканчивается кодирующая область. OrfPredictor облегчает аннотирование последовательностей, полученных из EST, особенно для крупномасштабных проектов EST.
ORF Predictor использует комбинацию двух разных определений ORF, упомянутых выше. Он ищет участки, начинающиеся со стартового кодона и заканчивающиеся стоп-кодоном. В качестве дополнительного критерия он ищет стоп-кодон в 5'- нетранслируемой области (UTR или NTR, нетранслируемая область). [ 18 ] ).
ОРФик
[ редактировать ]ORFik — это R-пакет в Bioconductor для поиска открытых рамок считывания и использования технологий секвенирования нового поколения для обоснования ORF. [ 19 ] [ 20 ]
orfipy
[ редактировать ]orfipy — это инструмент, написанный на Python / Cython для чрезвычайно быстрого и гибкого извлечения ORF. [ 21 ] orfipy может работать с простыми или сжатыми в gzip последовательностями FASTA и FASTQ и предоставляет несколько опций для тонкой настройки поиска ORF; к ним относятся указание стартовых и стоп-кодонов, сообщение о частичных ORF и использование пользовательских таблиц перевода. Результаты можно сохранить в нескольких форматах, включая компактный формат BED. orfipy особенно быстрее работает с данными, содержащими несколько более мелких последовательностей FASTA, таких как сборки транскриптома de novo. [ 22 ]
См. также
[ редактировать ]- Регион кодирования
- Предполагаемый ген
- Sequerome – инструмент профилирования последовательностей , который связывает каждую BLAST запись с ORF NCBI , обеспечивая полный анализ ORF отчета BLAST.
- Микропептид
Ссылки
[ редактировать ]- ^ Jump up to: а б Зибер П., Платцер М., Шустер С. (март 2018 г.). «Возвращение к определению открытой рамки чтения». Тенденции в генетике . 34 (3): 167–170. дои : 10.1016/j.tig.2017.12.009 . ПМИД 29366605 .
- ^ Броды Л.К. (25 августа 2021 г.). «Стоп Кодон» . Национальный институт исследования генома человека . Национальные институты здравоохранения . Проверено 25 августа 2021 г.
- ^ Слончевски Дж., Фостер Дж.В. (2009). Микробиология: развивающаяся наука . Нью-Йорк: WW Norton & Co. ISBN 978-0-393-97857-5 . OCLC 185042615 .
- ^ Клавери Дж. М. (1997). «Вычислительные методы идентификации генов в геномных последовательностях позвоночных» . Молекулярная генетика человека . 6 (10): 1735–44. дои : 10.1093/hmg/6.10.1735 . ПМИД 9300666 .
- ^ Jump up to: а б с д и Деониер Р., Таваре С. , Уотерман М. (2005). Компьютерный анализ генома: введение . Спрингер-Верлаг . п. 25. ISBN 978-0-387-98785-9 .
- ^ Клавери Дж. М., Пуаро О., Лопес Ф. (1997). «Трудность идентификации генов в анонимных последовательностях позвоночных». Компьютеры и химия . 21 (4): 203–14. дои : 10.1016/s0097-8485(96)00039-3 . ПМИД 9415985 .
- ^ Вакирлис, Николаос; Вэнс, Зоя; Дагган, Кейт М.; МакЛисахт, Аойф (2022). «Рождение de novo функциональных микропротеинов в человеческой линии» . Отчеты по ячейкам . 41 (12): 111808. doi : 10.1016/j.celrep.2022.111808 . ПМЦ 10073203 . ПМИД 36543139 . S2CID 254966620 .
- ^ Куте, Прити Мадхав; Сукарие, Омар; Тьелднес, Хокон; Трегуэ, Давид-Александр; Вален, Эйвинд (2022). «Маленькие открытые рамки для чтения, как их найти и определить их функцию» . Границы генетики . 12 : 796060. doi : 10.3389/fgene.2021.796060 . ПМЦ 8831751 . ПМИД 35154250 .
- ^ Занет Дж., Бенраба Э., Ли Т., Пелисье-Монье А., Чанут-Делаланд Х., Ронсен Б. и др. (сентябрь 2015 г.). «Пептиды PrisORF индуцируют селективный процессинг белка, опосредованный протеасомами». Наука . 349 (6254): 1356–1358. Бибкод : 2015Sci...349.1356Z . дои : 10.1126/science.aac5677 . ПМИД 26383956 . S2CID 206639549 .
- ^ Ветмар К., Барбоза-Сильва А., Андраде-Наварро М.А., Лойц А. (январь 2014 г.). «uORFdb — обширная база данных литературы по биологии эукариотических uORF» . Исследования нуклеиновых кислот . 42 (Проблема с базой данных): D60–D67. дои : 10.1093/нар/gkt952 . ПМЦ 3964959 . ПМИД 24163100 .
- ^ Гебалле, AP; Моррис, доктор медицинских наук (апрель 1994 г.). «Инициативные кодоны в 5'-лидерах мРНК как регуляторы трансляции» . Тенденции биохимических наук . 19 (4): 159–164. дои : 10.1016/0968-0004(94)90277-1 . ISSN 0968-0004 . ПМИД 8016865 .
- ^ Ли С., Лю Б., Ли С., Хуан SX, Шен Б., Цянь С.Б. (сентябрь 2012 г.). «Глобальное картирование сайтов инициации трансляции в клетках млекопитающих с разрешением в один нуклеотид» . Труды Национальной академии наук Соединенных Штатов Америки . 109 (37): Е2424–Е2432. дои : 10.1073/pnas.1207846109 . ПМЦ 3443142 . ПМИД 22927429 .
- ^ Шварц А.М., Путляева Л.В., Цович М., Клепикова А.В., Акулич К.А., Воронцов И.Е. и др. (октябрь 2016 г.). «Ранний B-клеточный фактор 1 (EBF1) имеет решающее значение для контроля транскрипции гена SLAMF1 в B-клетках человека». Biochimica et Biophysica Acta (BBA) - Механизмы регуляции генов . 1859 (10): 1259–1268. дои : 10.1016/j.bbagrm.2016.07.004 . ПМИД 27424222 .
- ^ Jump up to: а б Пирсон В.Р., Вуд Т., Чжан З., Миллер В. (ноябрь 1997 г.). «Сравнение последовательностей ДНК с последовательностями белков». Геномика . 46 (1): 24–36. дои : 10.1006/geno.1997.4995 . ПМИД 9403055 . S2CID 6413018 .
- ^ «ОРФиндер» . Национальный центр биотехнологической информации .
- ^ Дхар Д.В., Кумар М.С. (2012). «ORF Investigator: новый инструмент поиска ORF, сочетающий в себе парное глобальное выравнивание генов». Научно-исследовательский журнал новейших наук . 1 (11): 32–35.
- ^ «Орфпредиктор» . bioinformatics.ysu.edu . Архивировано из оригинала 22 декабря 2015 г. Проверено 17 декабря 2015 г.
- ^ Кэррингтон Дж. К., Фрид Д. Д. (апрель 1990 г.). «Кэп-независимое усиление трансляции с помощью 5'-нетранслируемой области растительного потивируса» . Журнал вирусологии . 64 (4): 1590–7. doi : 10.1128/JVI.64.4.1590-1597.1990 . ПМК 249294 . ПМИД 2319646 .
- ^ Корнел Лабун, Хокон Тьелднес (2018). «ОРФик – Открытые рамки считывания в геномике» . bioconductor.org . doi : 10.18129/B9.bioc.ORFik .
- ^ Тьелднес, Хакон; Кролик, Корнелиус; Торрес Клерен, Ямила; Чизинская, Катарина; Свирски, Майкл; Вален, Эйвинд (2021). «ORFik: Комплексный набор инструментов R для анализа перевода» . БМК Биоинформатика . 22 (1): 336. doi : 10.1186/s12859-021-04254-w . ПМЦ 8214792 . ПМИД 34147079 .
- ^ Сингх У, Вуртеле Э.С. (февраль 2021 г.). «orfipy: быстрый и гибкий инструмент для извлечения ORF» . Биоинформатика . 37 (18): 3019–3020. doi : 10.1093/биоинформатика/btab090 . ISSN 1367-4803 . ПМЦ 8479652 . ПМИД 33576786 .
- ^ Сингх У (13 февраля 2021 г.), urmi-21/orfipy , получено 13 февраля 2021 г.
Внешние ссылки
[ редактировать ]- Перевод и открытые рамки чтения
- hORFeome V5.1 — интерактивный веб-инструмент для коллекции CCSB Human ORFeome Collection.
- ORF Marker — бесплатный, быстрый и многоплатформенный настольный инструмент с графическим интерфейсом для прогнозирования и анализа ORF.
- StarORF — многоплатформенный инструмент с графическим интерфейсом на основе Java для прогнозирования и анализа ORF и получения обратной комплементарной последовательности.
- ORFPredictor. Архивировано 22 декабря 2015 г. на Wayback Machine — веб-сервер, предназначенный для прогнозирования ORF и трансляции пакета последовательностей EST или кДНК.