Точечная принятая мутация

Точечная принятая мутация также известная как PAM, представляет собой замену одной аминокислоты в первичной структуре белка , другой единственной аминокислотой, которая принимается процессами естественного отбора . Это определение не включает все точечные мутации в ДНК организма. В частности, «тихие» мутации не являются точечными мутациями, а также мутациями, которые не являются летальными или отвергаются естественным отбором другими способами.
Матрица PAM — это матрица , в которой каждый столбец и строка представляют одну из двадцати стандартных аминокислот. В биоинформатике матрицы PAM иногда используются в качестве матриц замен для оценки выравнивания последовательностей белков. Каждая запись в матрице PAM указывает на вероятность того, что аминокислота этой строки будет заменена аминокислотой этого столбца в результате серии одной или нескольких точечных принятых мутаций в течение определенного эволюционного интервала, а не на то, что эти две аминокислоты будут выровнены из-за на случайность. Различные матрицы PAM соответствуют разным промежуткам времени в эволюции белковой последовательности.
Биологическое происхождение
[ редактировать ]Генетические инструкции каждой реплицирующейся клетки живого организма содержатся в ее ДНК. [ 1 ] На протяжении всей жизни клетки эта информация транскрибируется и воспроизводится клеточными механизмами для производства белков или предоставления инструкций дочерним клеткам во время клеточного деления , и существует вероятность того, что ДНК может быть изменена во время этих процессов. [ 1 ] [ 2 ] Это известно как мутация . На молекулярном уровне существуют регуляторные системы, которые корректируют большинство (но не все) этих изменений в ДНК до того, как она будет реплицирована. [ 2 ] [ 3 ]
Одной из возможных мутаций является замена одного нуклеотида , известная как точечная мутация. Если точечная мутация происходит в экспрессируемой области гена , экзоне , то это приведет к изменению кодона, определяющего определенную аминокислоту в белке, продуцируемом этим геном. [ 2 ] Несмотря на избыточность генетического кода , существует вероятность того, что эта мутация затем изменит аминокислоту, образующуюся при трансляции , и, как следствие, изменится структура белка.
Функциональность белка во многом зависит от его структуры. [ 4 ] Изменение одной аминокислоты в белке может снизить его способность выполнять эту функцию, а мутация может даже изменить функцию, которую выполняет белок. [ 2 ] Подобные изменения могут серьезно повлиять на важнейшую функцию клетки, потенциально вызывая гибель клетки, а в крайних случаях и всего организма. [ 5 ] И наоборот, изменение может позволить клетке продолжать функционировать, хотя и по-другому, и мутация может быть передана потомству организма. Если это изменение не приведет к каким-либо значительным физическим недостаткам для потомства, существует вероятность того, что эта мутация сохранится в популяции. Также существует вероятность того, что изменение функции станет выгодным. В любом случае, подвергаясь процессам естественного отбора, точковая мутация была принята в генетический фонд.
20 аминокислот, транслируемые генетическим кодом, сильно различаются в зависимости от физических и химических свойств их боковых цепей. [ 4 ] Однако эти аминокислоты можно разделить на группы со схожими физико-химическими свойствами. [ 4 ] Замена аминокислоты другой из той же категории с большей вероятностью окажет меньшее влияние на структуру и функцию белка, чем замена аминокислотой из другой категории. Следовательно, принятие точковых мутаций во многом зависит от аминокислоты, заменяемой в мутации, и замещающей аминокислоты. Матрицы PAM представляют собой математический инструмент, который учитывает различную степень приемлемости при оценке сходства белков во время выравнивания.
Терминология
[ редактировать ]Термин «принятая точечная мутация» первоначально использовался для описания явления мутации. Однако аббревиатура PAM была предпочтительнее APM из-за удобочитаемости, поэтому термин «точечная принятая мутация» используется более регулярно. [ 6 ] Потому что значение в матрице PAM n представляет собой количество мутаций на 100 аминокислот, которое можно сравнить с процентом мутаций, термин «процент принятой мутации» иногда используется .
Важно различать точечные принятые мутации (PAM), точечные принятые мутации (матрицы PAM) и матрицу PAM n . Термин «точечная принятая мутация» относится к самому событию мутации. Однако «матрица PAM» относится к одной из семейства матриц, которые содержат оценки, представляющие вероятность выравнивания двух аминокислот из-за серии событий мутации, а не из-за случайной случайности. «Матрица PAM n » — это матрица PAM, соответствующая периоду времени, достаточно длинному для мутационные события происходят на 100 аминокислот.
Построение матриц PAM
[ редактировать ]Матрицы PAM были представлены Маргарет Дэйхофф в 1978 году. [ 7 ] Расчет этих матриц основан на 1572 наблюдаемых мутациях в филогенетических деревьях 71 семейства близкородственных белков. Белки для изучения были выбраны на основании высокого сходства со своими предшественниками. Включенные выравнивания белков должны были демонстрировать не менее 85% идентичности. [ 6 ] [ 8 ] В результате разумно предположить, что любые выровненные несоответствия были результатом одного события мутации, а не нескольких в одном и том же месте.
Каждая матрица PAM имеет двадцать строк и двадцать столбцов — по одному, представляющему каждую из двадцати аминокислот, транслируемых генетическим кодом. Значение в каждой ячейке матрицы PAM связано с вероятностью того, что аминокислота строки до мутации впоследствии будет выровнена с аминокислотой столбца. [ 6 ] [ 7 ] [ 8 ] Согласно этому определению, матрицы PAM являются примером матрицы замены .
Сбор данных с филогенетических деревьев
[ редактировать ]Для каждой ветви филогенетических деревьев белковых семейств регистрировали количество наблюдавшихся несовпадений и сохраняли записи о двух задействованных аминокислотах. [ 7 ] Эти значения использовались как записи ниже главной диагонали матрицы. . Поскольку подавляющее большинство образцов белка происходит от живых сегодня организмов (существующих видов), «направление» мутации определить невозможно. То есть аминокислоту, присутствовавшую до мутации, невозможно отличить от аминокислоты, которая заменила ее после мутации. Из-за этого матрица предполагается симметричным , а записи выше главной диагонали рассчитываются на этой основе. Записи по диагонали не соответствуют мутациям и их можно оставить незаполненными.
Помимо этих подсчетов были получены данные об мутабельности и частоте аминокислот. [ 6 ] [ 7 ] Мутабельность аминокислоты — это соотношение количества мутаций, в которых она участвует, и количества раз, когда она встречается в выравнивании. [ 7 ] Мутабельность измеряет вероятность приемлемой мутации аминокислоты. Аспарагин , аминокислота с небольшой полярной боковой цепью, оказалась наиболее изменчивой из аминокислот. [ 7 ] Цистеин и триптофан оказались наименее мутабельными аминокислотами. [ 7 ] Боковые цепи цистеина и триптофана имеют менее общую структуру: боковая цепь цистеина содержит серу, которая участвует в дисульфидных связях с другими молекулами цистеина, а боковая цепь триптофана большая и ароматическая . [ 4 ] Поскольку существует несколько небольших полярных аминокислот, эти крайности предполагают, что аминокислоты с большей вероятностью будут приемлемо мутировать, если их физические и химические свойства более распространены среди альтернативных аминокислот. [ 6 ] [ 8 ]
Построение матрицы мутаций
[ редактировать ]Для аминокислота, значения и являются его изменчивость и частота. Частоты аминокислот нормализуются так, что их сумма равна 1. Если общее количество появлений эта аминокислота , и - общее количество всех аминокислот, тогда
На основе определения мутабельности как отношения мутаций к появлению аминокислоты.
или
Матрица мутаций построено так, что запись представляет собой вероятность аминокислота, мутирующая в ая аминокислота. Недиагональные элементы вычисляются по уравнению [ 7 ]
где является константой пропорциональности. Однако это уравнение не вычисляет диагональные элементы. Каждый столбец матрицы перечисляет каждый из двадцати возможных результатов для аминокислоты — она может мутировать в одну из 19 других аминокислот или оставаться неизменной. Поскольку недиагональные записи, в которых перечислены вероятности каждой из 19 мутаций, известны, а сумма вероятностей этих двадцати исходов должна быть равна 1, эту последнюю вероятность можно вычислить по формуле
что упрощается до [ 7 ]
Расчет диагональных вхождений
Результатом особого значения является то, что для недиагональных записей
Это означает, что для всех записей в матрице мутаций
Выбор константы пропорциональности
[ редактировать ]Вероятности, содержащиеся в варьируются как некоторая неизвестная функция времени, в течение которого белковая последовательность может мутировать. Вместо того, чтобы пытаться определить эту взаимосвязь, значения рассчитываются для короткого периода времени, а матрицы для более длительных периодов времени рассчитываются, предполагая, что мутации следуют модели цепи Маркова . [ 9 ] [ 10 ] Базовой единицей времени для матриц PAM является время, необходимое для возникновения 1 мутации на 100 аминокислот, иногда называемое «единицей PAM» или «PAM» времени. [ 6 ] Именно такую продолжительность мутации предполагает матрица PAM 1 .
Константа используется для контроля доли неизмененных аминокислот. Используя только те выравнивания белков, которые имели сходство не менее 85%, можно было разумно предположить, что наблюдаемые мутации были прямыми, без каких-либо промежуточных состояний. Это означает, что уменьшение этих подсчетов на общий коэффициент позволило бы получить точную оценку количества мутаций, если бы сходство было ближе к 100%. Это также означает, что количество мутаций на 100 аминокислот, в PAM n равно числу мутированных аминокислот на 100 аминокислот.
Чтобы найти матрицу мутаций для матрицы PAM 1 , налагается требование, чтобы 99% аминокислот в последовательности были консервативными. Количество равно количеству консервативных аминокислот единиц, поэтому общее количество консервативных аминокислот равно
Стоимость необходимо выбрать, чтобы получить 99% идентичности после мутации, тогда определяется уравнением
Этот значение затем можно использовать в матрице мутаций для матрицы PAM 1 .
Построение PAM n матриц
[ редактировать ]Модель мутации белка с помощью цепи Маркова связывает матрицу мутаций для PAM n , , к матрице мутаций для матрицы PAM 1 , по простому отношению
Матрица PAM n строится из отношения вероятности точечных принятых мутаций, заменяющих аминокислота с аминокислоты, к вероятности того, что эти аминокислоты выровнены случайно. Элементы матрицы PAM n задаются уравнением [ 11 ] [ 12 ]
Обратите внимание, что в книге Гасфилда записи и связаны с вероятностью аминокислота, мутирующая в ая аминокислота. [ 11 ] Это источник различных уравнений для записей матриц PAM.
При использовании матрицы PAM n для оценки выравнивания двух белков делается следующее предположение:
- Если эти два белка родственны, эволюционный интервал, разделяющий их, представляет собой время, необходимое для точечные допустимые мутации происходят на 100 аминокислот.
Когда выравнивание й и аминокислоты, балл указывает относительную вероятность выравнивания из-за родства белков или из-за случайной случайности.
- Если белки родственны, должна была произойти серия точечных мутаций, которые превратили исходную аминокислоту в замену. Предположим, Эта аминокислота является исходной. Судя по обилию аминокислот в белках, вероятность Эта аминокислота является исходной . Учитывая любую конкретную единицу этой аминокислоты, вероятность ее замены на -я аминокислота в предполагаемом интервале времени равна . Таким образом, вероятность совпадения равна , числитель внутри логарифма.
- Если белки не связаны между собой, события, заключающиеся в том, что две выровненные аминокислоты являются й и Аминокислоты должны быть независимыми . Вероятности этих событий и , что означает, что вероятность выравнивания равна , знаменатель логарифма.
- Таким образом, логарифм в уравнении дает положительную запись, если выравнивание более вероятно из-за точечных принятых мутаций, и отрицательную запись, если совпадение более вероятно из-за случайности.
Свойства матриц PAM
[ редактировать ]Симметрия матриц PAM
[ редактировать ]Хотя матрица вероятности мутации не симметрична, каждая из матриц PAM. [ 6 ] [ 7 ] Это несколько удивительное свойство является результатом соотношения, которое было отмечено для матрицы вероятности мутации:
Фактически это соотношение справедливо для всех целых положительных степеней матрицы :
Обобщение свойства на степени положительных целых матриц.
В результате элементы матрицы PAM n симметричны, поскольку
Связь между количеством мутировавших аминокислот и количеством мутаций
[ редактировать ]Значение представляет собой количество мутаций, происходящих на 100 аминокислот, однако это значение редко доступно и часто оценивается. Однако при сравнении двух белков легко вычислить вместо этого это количество мутировавших аминокислот на 100 аминокислот. Несмотря на случайный характер мутации, эти значения можно приближенно связать соотношением [ 13 ]
Вывод отношений между и
Справедливость этих оценок можно проверить, подсчитав количество аминокислот, оставшихся неизменными под действием матрицы . Общее количество неизмененных аминокислот за интервал времени матрицы PAM n равно
и поэтому доля неизмененных аминокислот равна
Пример — ПАМ250
[ редактировать ]
PAM250 — это широко используемая оценочная матрица для сравнения последовательностей. Необходимо вычислить только нижнюю половину матрицы, поскольку по своей конструкции матрицы PAM должны быть симметричными. Каждая из 20 аминокислот показана сверху и сбоку матрицы, а также 3 дополнительные неоднозначные аминокислоты . Аминокислоты чаще всего отображаются в алфавитном порядке или в группах. Эти группы являются характеристиками, общими для аминокислот. [ 7 ]
Использование в биоинформатике
[ редактировать ]Определение времени расхождения в филогенетических деревьях
[ редактировать ]Гипотеза молекулярных часов предсказывает, что скорость замены аминокислот в конкретном белке будет примерно постоянной с течением времени, хотя эта скорость может варьироваться в зависимости от семейства белков. [ 13 ] Это говорит о том, что количество мутаций на аминокислоту в белке увеличивается примерно линейно со временем.
Определение времени дивергенции двух белков — важная задача филогенетики . Записи окаменелостей часто используются для установления положения событий на временной шкале эволюционной истории Земли, но применение этого источника ограничено . Однако если известна скорость, с которой тикают молекулярные часы семейства белков, то есть скорость, с которой увеличивается количество мутаций на аминокислоту, то знание этого количества мутаций позволит определить дату расхождения.
Предположим, ведется поиск даты расхождения двух родственных белков, взятых из ныне живущих организмов. Оба белка накопили принятые мутации с момента расхождения, и поэтому общее количество мутаций на каждую аминокислоту, разделяющую их, примерно вдвое превышает то, которое отделяет их от общего предка . Если для выравнивания двух белков, о которых известно, что они родственны, используется ряд матриц PAM, то значение в матрице PAM n , что дает лучший результат, скорее всего, соответствует мутациям на аминокислоту, разделяющим два белка. Уменьшив это значение вдвое и разделив его на скорость накопления принятых мутаций в семействе белков, можно оценить время расхождения этих двух белков от их общего предка. То есть время расхождения в myr равно [ 13 ]
Где - количество мутаций на аминокислоту, и - это скорость накопления принятых мутаций на аминокислотный участок за миллион лет.
Использование в BLAST
[ редактировать ]Матрицы PAM также используются в качестве оценочной матрицы при сравнении последовательностей ДНК или последовательностей белков для оценки качества выравнивания. Эта форма системы подсчета очков используется в широком спектре программного обеспечения для выравнивания, включая BLAST . [ 15 ]
Сравнение PAM и BLOSUM
[ редактировать ]Хотя матрицы логарифмов шансов PAM были первыми оценочными матрицами, использованными в BLAST, матрицы PAM в значительной степени были заменены матрицами BLOSUM . Хотя обе матрицы дают схожие результаты оценки, они были получены с использованием разных методологий. Матрицы BLOSUM были созданы непосредственно из аминокислотных различий в выровненных блоках, которые разошлись в разной степени. Матрицы PAM отражают экстраполяцию эволюционной информации, основанной на близкородственных последовательностях, на более длительные временные рамки. [ 16 ] Поскольку оценочная информация для матриц PAM и BLOSUM генерировалась совершенно разными способами, числа, связанные с матрицами, имеют принципиально разные значения; числа для матриц PAM увеличиваются при сравнении более дивергентных белков, тогда как числа для матриц BLOSUM уменьшаются. [ 17 ] Однако все матрицы аминокислотных замен можно сравнить в рамках теории информации. [ 18 ] используя их относительную энтропию.
Матрица PAM | Эквивалентная матрица BLOSUM | Относительная энтропия (биты) |
---|---|---|
ПАМ100 | Блосум90 | 1.18 |
ПАМ120 | Блосум89 | 0.98 |
ПАМ160 | Блосум60 | 0.70 |
ПАМ200 | Блосум52 | 0.51 |
ПАМ250 | Блосум45 | 0.36 |
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Перейти обратно: а б Кэмпбелл Н.А., Рис Дж.Б., Мейерс Н., Урри Л.А., Кейн М.Л., Вассерман С.А., Минорский П.В., Джексон Р.Б. (2009). «Молекулярные основы наследственности». Биология (8-е изд.). Пирсон Образования Австралии. стр. 307–325. ISBN 9781442502215 .
- ^ Перейти обратно: а б с д Кэмпбелл Н.А., Рис Дж.Б., Мейерс Н., Урри Л.А., Кейн М.Л., Вассерман С.А., Минорский П.В., Джексон Р.Б. (2009). «От гена к белку». Биология: австралийская версия (8-е изд.). Пирсон Образования Австралии. стр. 327–350. ISBN 9781442502215 .
- ^ Пал Дж.К., Гаскадби С.С. (2009). «Повреждение, восстановление и рекомбинация ДНК». Основы молекулярной биологии (1-е изд.). Издательство Оксфордского университета. стр. 187–203 . ISBN 9780195697810 .
- ^ Перейти обратно: а б с д Кэмпбелл Н.А., Рис Дж.Б., Мейерс Н., Урри Л.А., Кейн М.Л., Вассерман С.А., Минорский П.В., Джексон Р.Б. (2009). «Структура и функции крупных биологических молекул». Биология: австралийская версия (8-е изд.). Пирсон Образования Австралии. стр. 68–89. ISBN 9781442502215 .
- ^ Лобо I (январь 2008 г.). «Менделевские соотношения и летальные гены» . Природное образование . 1 (1): 138.
- ^ Перейти обратно: а б с д и ж г Певснер Дж (2009). «Попарное выравнивание последовательностей». Биоинформатика и функциональная геномика (2-е изд.). Уайли-Блэквелл. стр. 58–68 . ISBN 978-0-470-08585-1 .
- ^ Перейти обратно: а б с д и ж г час я дж к Дайхофф М.О., Шварц Р.М., Оркатт, Британская Колумбия (1978). «Модель эволюционного изменения белков». Атлас последовательности и структуры белков (т. 5, приложение 3-го изд.). Вашингтон, округ Колумбия: Национальный фонд биомедицинских исследований. стр. 345–358. ISBN 978-0-912466-07-1 .
- ^ Перейти обратно: а б с Винг-Кин С (2010). Алгоритмы в биоинформатике: практическое введение . ЦРК Пресс. стр. 51–52. ISBN 978-1-4200-7033-0 .
- ^ Косиол С., Гольдман Н. (2005). «Различные версии матрицы ставок Дайхоффа» . Молекулярная биология и эволюция . 22 (2): 193–9. дои : 10.1093/molbev/msi005 . ПМИД 15483331 .
- ^ Лио П., Гольдман Н. (1998). «Модели молекулярной эволюции и филогении» . Геномные исследования . 8 (12): 1233–44. дои : 10.1101/гр.8.12.1233 . ПМИД 9872979 .
- ^ Перейти обратно: а б Гасфилд Д. (1997). Алгоритмы для строк, деревьев и последовательностей - информатика и вычислительная биология . Издательство Кембриджского университета. стр. 383–384. ISBN 978-0521585194 .
- ^ Бёкенхауэр Х.Дж., Бонгарц Д. (2010). Алгоритмические аспекты биоинформатики . Спрингер. стр. 94–96. ISBN 978-3642091001 .
- ^ Перейти обратно: а б с Певснер Дж (2009). «Молекулярная филогения и эволюция». Биоинформатика и функциональная геномика (2-е изд.). Уайли-Блэквелл. стр. 221–227 . ISBN 978-0-470-08585-1 .
- ^ Мотвани Р., Рагхаван П. (1995). Рандомизированные алгоритмы . Издательство Кембриджского университета. п. 94. ИСБН 978-0521474658 .
- ^ «Статистика показателей сходства последовательностей» . Национальный центр биотехнологической информации . Проверено 20 октября 2013 г.
- ^ Хеникофф С. , Хеникофф Дж.Г. (1992). «Матрицы аминокислотных замен из белковых блоков» . Труды Национальной академии наук Соединенных Штатов Америки . 89 (22): 10915–10919. Бибкод : 1992PNAS...8910915H . дои : 10.1073/pnas.89.22.10915 . ПМЦ 50453 . ПМИД 1438297 .
- ^ Сауд О (2009). «Матрицы замещения PAM и BLOSUM» . Бирец . Архивировано из оригинала 9 марта 2013 года . Проверено 20 октября 2013 г.
- ^ Перейти обратно: а б Альтшул С.Ф. (июнь 1991 г.). «Матрицы аминокислотных замен с точки зрения теории информации» . Журнал молекулярной биологии . 219 (3): 555–65. дои : 10.1016/0022-2836(91)90193-А . ПМК 7130686 . ПМИД 2051488 .
Внешние ссылки
[ редактировать ]- http://www.inf.ethz.ch/personal/gonnet/DarwinManual/node148.html
- http://www.bioinformatics.nl/tools/pam.html Для быстрого расчета матрицы PAM.
- http://web.expasy.org/docs/relnotes/relstat.html Самые последние статистические данные из базы знаний о белках Swiss-Prot. Раздел 6.1 содержит самые актуальные частоты аминокислот.