K a /K s Соотношение
В генетике соотношение K a /K , d также известное как ω или d N / S s соотношение , [ а ] используется для оценки баланса между нейтральными мутациями , очищающим отбором и полезными мутациями, действующими на набор гомологичных генов, кодирующих белок . Его рассчитывают как отношение количества несинонимичных замен на несинонимичный сайт (K a ) за данный период времени к числу синонимичных замен на один синонимичный сайт (K s ) за тот же период. Последние считаются нейтральными, так что соотношение указывает на чистый баланс между вредными и полезными мутациями. Значения K a /K s , значительно превышающие 1, маловероятны, если хотя бы некоторые мутации не будут полезными. Если предполагается, что полезные мутации вносят небольшой вклад, то K a /K s оценивает степень эволюционного ограничения .
Контекст
[ редактировать ]Отбор действует на вариации фенотипов, которые часто являются результатом мутаций в белок кодирующих генах, . Генетический код записан в последовательностях ДНК в виде кодонов , групп из трех нуклеотидов . Каждый кодон представляет собой одну аминокислоту в белковой цепи. Однако в белках содержится больше кодонов (64), чем аминокислот (20), поэтому многие кодоны фактически являются синонимами. Например, кодоны ДНК ТТТ и ТТС кодируют аминокислоту фенилаланин , поэтому изменение третьего Т на С не влияет на полученный белок. С другой стороны, кодон GAG кодирует глутаминовую кислоту , а кодон GTG кодирует валин , поэтому изменение средней А на Т действительно меняет полученный белок в лучшую или (что более вероятно) худшую сторону. [ б ] так что изменение не является синонимом. Эти изменения проиллюстрированы в таблицах ниже.
Отношение K a /K s измеряет относительную частоту синонимичных и несинонимичных замен в конкретном сайте.
Тип конструкции | До | Изменять | После | Результат |
---|---|---|---|---|
Кодон в последовательности ДНК | ТТТ | безвредная мутация; [ с ] Синонимическая замена |
ТТС | |
↓ коды для | ↓ коды для | ↓ коды для | ||
Аминокислота в белке | Фенилаланин | без изменений | Фенилаланин | Нормальный белок, нормальная функция |
Тип конструкции | До | Изменять | После | Результат |
---|---|---|---|---|
Кодон в последовательности ДНК | кляп | Миссенс-мутация ; Несинонимическая замена |
ГТГ | |
↓ коды для | ↓ коды для | ↓ коды для | ||
Аминокислота в белке | Глутаминовая кислота | структурные изменения | Валин | Измененный белок может причинить или не нанести вред (например, болезнь) или дать новое преимущество |
Методы
[ редактировать ]Методы оценки K a и K s используют выравнивание последовательностей двух или более нуклеотидных последовательностей гомологичных генов, которые кодируют белки (а не являются генетическими переключателями, контролирующими развитие или скорость активности других генов). Методы можно разделить на три группы: приближенные методы, методы максимального правдоподобия и методы счета. Однако, если сравниваемые последовательности не имеют отдаленного родства (в этом случае преобладают методы максимального правдоподобия), класс используемого метода оказывает минимальное влияние на полученные результаты; более важными являются предположения, заложенные в выбранном методе. [ 1 ] : 498
Приблизительные методы
[ редактировать ]Приближенные методы включают три основных этапа: (1) подсчет количества синонимичных и несинонимичных сайтов в двух последовательностях или оценка этого числа путем умножения длины последовательности на долю каждого класса замен; (2) подсчет количества синонимичных и несинонимичных замен; и (3) поправка на множественные замены.
Эти шаги, особенно последний, требуют упрощенных предположений, если они должны быть достигнуты вычислительным путем; по причинам, которые будут обсуждаться позже, невозможно точно определить количество множественных замен. [ 1 ]
Методы максимального правдоподобия
[ редактировать ]Подход максимального правдоподобия использует теорию вероятностей для одновременного выполнения всех трех шагов. [ 1 ] Он оценивает критические параметры, включая расхождение между последовательностями и коэффициент перехода/трансверсии, путем определения наиболее вероятных значений для создания входных данных. [ 1 ]
Методы подсчета
[ редактировать ]Чтобы количественно оценить количество замен, можно реконструировать предковую последовательность и записать предполагаемые изменения в сайтах (прямой подсчет - вероятно, приведет к занижению оценки); подгонка коэффициентов замещения на участках к заранее определенным категориям ( байесовский подход; неудовлетворителен для небольших наборов данных); и генерирование индивидуальной скорости замены для каждого кодона (затратно в вычислительном отношении). При наличии достаточного количества данных все три подхода приведут к одному и тому же результату. [ 2 ]
Интерпретация результатов
[ редактировать ]Соотношение K a /K s используется для вывода о направлении и величине естественного отбора, действующего на гены, кодирующие белки. Коэффициент больше 1 подразумевает положительный или дарвиновский отбор (движущее изменение); меньше 1 означает очищающий или стабилизирующий отбор (действующий против изменений); а соотношение ровно 1 указывает на нейтральный (т.е. отсутствие) выбора. Однако сочетание положительного и очищающего отбора в разных точках гена или на разных этапах его эволюции может нейтрализовать друг друга. Полученное усредненное значение может замаскировать присутствие одного из выборов и снизить кажущуюся величину другого выбора.
Конечно, необходимо провести статистический анализ, чтобы определить, значительно ли результат отличается от 1 или может возникнуть какое-либо явное различие в результате ограниченного набора данных. Соответствующая статистическая проверка приближенного метода включает аппроксимацию dN - dS с помощью нормального приближения и определение того, попадает ли 0 в центральную область приближения. Для анализа результатов анализа максимального правдоподобия можно использовать более сложные методы правдоподобия, выполняя тест хи-квадрат, чтобы отличить нулевую модель (K a /K s = 1) от наблюдаемых результатов. [ 1 ]
Утилита
[ редактировать ]Отношение K a /K s является более мощным тестом нейтральной модели эволюции, чем многие другие, доступные в популяционной генетике, поскольку оно требует меньше предположений. [ 1 ]
Осложнения
[ редактировать ]Часто существует систематическая ошибка в частоте замены различных нуклеотидов , поскольку одни мутации более вероятны, чем другие. [ 1 ] Например, некоторые линии могут заменять C на T чаще, чем C на A. В случае аминокислоты аспарагин , которая кодируется кодонами AAT или AAC, высокая скорость обмена C->T увеличит долю синонимичных замен в этом кодоне, тогда как высокая скорость обмена C→A увеличит частоту несинонимичных замен. Поскольку переходы (T↔C и A↔G) довольно часто предпочтительнее трансверсий (других изменений), [ 1 ] модели должны учитывать возможность неоднородности обменных курсов. [ 3 ] Некоторые более простые приближенные методы, такие как методы Мияты и Ясунаги и Нея и Годобори, не принимают их во внимание, что приводит к увеличению времени вычислений за счет точности; эти методы будут систематически переоценивать N и недооценивать S. [ 1 ]
Кроме того, может существовать предвзятость, при которой в гене предпочтительнее определенные кодоны, поскольку определенная комбинация кодонов может повысить эффективность трансляции. [ 1 ] Исследование 2022 года показало, что синонимические мутации в репрезентативных генах дрожжей в основном сильно ненейтральны, что ставит под сомнение предположения, лежащие в основе использования соотношения K a / K s . [ 4 ]
Кроме того, с течением времени сайт может претерпеть множество изменений. Например, кодон может переключаться с ААА→ААС→ААТ→ААА. Невозможно обнаружить множественные замены в одном сайте, поэтому оценка количества замен всегда занижена. Кроме того, в приведенном выше примере в третьем сайте произошли две несинонимичные и одна синонимичная замена; однако, поскольку замены восстанавливали исходную последовательность, доказательств какой-либо замены нет. По мере увеличения времени расхождения между двумя последовательностями увеличивается и количество множественных замен. Таким образом, «длинные ветви» в анализе dN/dS могут привести к недооценке как dN, так и dS, и чем длиннее ветвь, тем труднее исправить внесенный шум. [ 3 ] Конечно, наследственная последовательность обычно неизвестна, и две сравниваемые линии развиваются параллельно со времени их последнего общего предка. Этот эффект можно смягчить, построив предковую последовательность; Точность этой последовательности повышается за счет наличия большого количества последовательностей, происходящих от этого общего предка, что позволяет ограничить ее последовательность филогенетическими методами. [ 1 ]
Методы, учитывающие отклонения в использовании кодонов и скорости перехода/трансверсии, существенно более надежны, чем те, которые этого не делают. [ 1 ]
Ограничения
[ редактировать ]Хотя соотношение K a /K s является хорошим индикатором давления отбора на уровне последовательности, эволюционные изменения часто могут происходить в регуляторной области гена, что влияет на уровень, время или место экспрессии гена. Анализ K a /K s не обнаружит такого изменения. Он будет рассчитывать только селективное давление внутри областей, кодирующих белок. отбор, который не вызывает различий на уровне аминокислот (например, балансирующий отбор) . Кроме того, этими методами невозможно обнаружить [ 1 ]
Другая проблема заключается в том, что гетерогенность внутри гена может затруднить интерпретацию результата. Например, если K a /K s = 1, это может быть следствием ослабленного отбора или химеры позитивного и очищающего отбора в локусе. Решением этого ограничения могло бы стать применение анализа K a /K s для многих видов по отдельным кодонам.
Метод K a /K s требует довольно сильного сигнала для обнаружения селекции. Чтобы обнаружить отбор между линиями, отбор, усредненный по всем участкам последовательности, должен дать K a /K s больше единицы — настоящий подвиг, если участки гена сильно консервативны. Чтобы обнаружить отбор на определенных сайтах, соотношение K a /K s должно быть больше единицы при усреднении по всем включенным линиям на этом сайте - подразумевая, что сайт должен находиться под давлением отбора во всех отобранных линиях. Это ограничение можно смягчить, позволив коэффициенту K a /K s принимать несколько значений для разных сайтов и линий; включение большего количества линий также увеличивает эффективность подхода, основанного на сайтах. [ 1 ]
Кроме того, методу не хватает возможности различать положительные и отрицательные несинонимичные замены. Некоторые аминокислоты химически похожи друг на друга, тогда как другие замены могут привести к тому, что аминокислота будет иметь совершенно разные свойства по сравнению с ее предшественником. В большинстве ситуаций небольшое химическое изменение с большей вероятностью позволит белку продолжать функционировать, а большое химическое изменение может нарушить химическую структуру и вызвать сбой в работе белка. Однако включить это в модель непросто, поскольку очень сложно определить взаимосвязь между заменой нуклеотидов и эффектами измененных химических свойств. [ 1 ]
Дополнительная проблема заключается в том, что влияние времени необходимо учитывать в анализе, если сравниваемые линии тесно связаны; Это связано с тем, что естественному отбору может потребоваться несколько поколений, чтобы «отсеять» вредные мутации из популяции, особенно если их влияние на приспособленность слабое. [ 5 ] [ 6 ] [ 7 ] [ 8 ] Это ограничивает полезность отношения K a /K s для сравнения близкородственных популяций.
Индивидуальный кодоновый подход
[ редактировать ]Дополнительную информацию можно получить путем определения соотношения K a /K s для конкретных кодонов в последовательности гена. Например, область опсина, регулирующая частоту, может находиться под повышенным селективным давлением, когда вид колонизируется и адаптируется к новой среде, тогда как область, ответственная за инициализацию нервного сигнала, может находиться под очищающим отбором. Чтобы обнаружить такие эффекты, в идеале было бы рассчитать соотношение K a /K s в каждом месте. Однако это требует больших вычислительных затрат, и на практике устанавливается несколько классов K a /K s , и каждому сайту присваивается наиболее подходящий класс. [ 1 ]
Первым шагом в определении того, действует ли положительный отбор на участках, является сравнение теста, в котором отношение K a /K s ограничено значением < 1 на всех участках, с тестом, в котором оно может принимать любое значение, и посмотреть, допускает ли K a /K . Превышение 1 на некоторых участках улучшает соответствие модели. Если это так, то сайты, попадающие в класс, где K a /K s > 1, являются кандидатами на положительный отбор. Эта форма теста может либо идентифицировать участки, которые могут быть изучены в ходе дальнейших лабораторных исследований, чтобы определить возможное селективное давление; или сайты, которые, как полагают, имеют функциональное значение, могут быть отнесены к различным классам K a /K s перед запуском модели. [ 1 ]
Примечания
[ редактировать ]- ^ Термины K a /K s и d N / d S используются как взаимозаменяемые. Однако обратите внимание, что n и D s являются параметрами, отличными от N и d S ( или KA и d KS D ). D n и D s представляют собой оценки количества, которые представляют собой общее количество несинонимичных и синонимичных замен.
- ^ «Лучше» означает, что изменение выгодно и будет выбрано путем естественного отбора. «Хуже» означает, что изменение вредно и будет выбрано против.
- ^ Часто, но не всегда, « тихая мутация ».
Ссылки
[ редактировать ]- ^ Перейти обратно: а б с д и ж г час я дж к л м н тот п д Ян З., Белявски Дж. П. (декабрь 2000 г.). «Статистические методы обнаружения молекулярной адаптации» . Тенденции в экологии и эволюции . 15 (12): 496–503. CiteSeerX 10.1.1.19.6537 . дои : 10.1016/S0169-5347(00)01994-7 . ПМЦ 7134603 . ПМИД 11114436 .
- ^ Косаковский пруд С.Л., Морозный С.Д. (май 2005 г.). «В конце концов, не такие уж и разные: сравнение методов обнаружения селекционных участков аминокислот». Молекулярная биология и эволюция . 22 (5): 1208–1222. дои : 10.1093/molbev/msi105 . ПМИД 15703242 .
- ^ Перейти обратно: а б Херст LD (сентябрь 2002 г.). «Отношение Ka/Ks: диагностика формы эволюции последовательности». Тенденции в генетике . 18 (9): 486–487. дои : 10.1016/S0168-9525(02)02722-1 . ПМИД 12175810 .
- ^ Шэнь X, Сун С, Ли С, Чжан Дж (июнь 2022 г.). «Синонимические мутации в репрезентативных генах дрожжей в большинстве случаев сильно ненейтральны» . Природа . 606 (7915): 725–731. Бибкод : 2022Natur.606..725S . doi : 10.1038/s41586-022-04823-w . ПМЦ 9650438 . PMID 35676473 . S2CID 249520936 .
- ^ Роча Э.П., Смит Дж.М., Херст Л.Д., Холден М.Т., Купер Дж.Е., Смит Н.Х., Фейл Э.Дж. (март 2006 г.). «Сравнение dN/dS зависит от времени для близкородственных бактериальных геномов». Журнал теоретической биологии . 239 (2): 226–235. Бибкод : 2006JThBi.239..226R . дои : 10.1016/j.jtbi.2005.08.037 . ПМИД 16239014 .
- ^ Кряжимский С., Плоткин Ю.Б. (декабрь 2008 г.). «Популяционная генетика dN/dS» . ПЛОС Генетика . 4 (12): e1000304. дои : 10.1371/journal.pgen.1000304 . ПМК 2596312 . ПМИД 19081788 .
- ^ Петерсон Г.И., Масел Дж. (ноябрь 2009 г.). «Количественное предсказание молекулярных часов и ka/ks в короткие сроки» . Молекулярная биология и эволюция . 26 (11): 2595–2603. дои : 10.1093/molbev/msp175 . ПМЦ 2912466 . ПМИД 19661199 .
- ^ Мугал К.Ф., Вольф Дж.Б., Кай И. (январь 2014 г.). «Почему время имеет значение: эволюция кодонов и временная динамика dN/dS» . Молекулярная биология и эволюция . 31 (1): 212–231. дои : 10.1093/molbev/mst192 . ПМЦ 3879453 . ПМИД 24129904 .
Дальнейшее чтение
[ редактировать ]- Комерон Дж. М. (декабрь 1995 г.). «Метод оценки количества синонимичных и несинонимичных замен на сайт». Журнал молекулярной эволюции . 41 (6): 1152–1159. Бибкод : 1995JMolE..41.1152C . дои : 10.1007/bf00173196 . ПМИД 8587111 . S2CID 19262479 .
- Гольдман Н., Ян З. (сентябрь 1994 г.). «Модель нуклеотидной замены на основе кодонов в последовательностях ДНК, кодирующих белок». Молекулярная биология и эволюция . 11 (5): 725–736. doi : 10.1093/oxfordjournals.molbev.a040153 . ПМИД 7968486 .
- Херст LD (сентябрь 2002 г.). «Отношение Ka/Ks: диагностика формы эволюции последовательности». Тенденции в генетике . 18 (9): 486–487. дои : 10.1016/S0168-9525(02)02722-1 . ПМИД 12175810 .
- Ина Ю. (февраль 1995 г.). «Новые методы оценки количества синонимичных и несинонимичных замен». Журнал молекулярной эволюции . 40 (2): 190–226. Бибкод : 1995JMolE..40..190I . дои : 10.1007/bf00167113 . ПМИД 7699723 . S2CID 25430897 .
- Ли WH (январь 1993 г.). «Непредвзятая оценка показателей синонимичной и несинонимической замены». Журнал молекулярной эволюции . 36 (1): 96–99. Бибкод : 1993JMolE..36...96L . дои : 10.1007/bf02407308 . ПМИД 8433381 . S2CID 21618703 .
- Ли WH , Ву CI, Луо CC (март 1985 г.). «Новый метод оценки синонимичных и несинонимичных показателей нуклеотидных замен с учетом относительной вероятности изменений нуклеотидов и кодонов» . Молекулярная биология и эволюция . 2 (2): 150–174. doi : 10.1093/oxfordjournals.molbev.a040343 . ПМИД 3916709 .
- Муза С.В., Гаут Б.С. (сентябрь 1994 г.). «Правдоподобный подход для сравнения показателей синонимичных и несинонимичных нуклеотидных замен с применением к геному хлоропластов» . Молекулярная биология и эволюция . 11 (5): 715–724. doi : 10.1093/oxfordjournals.molbev.a040152 . ПМИД 7968485 .
- Ней М., Годобори Т. (сентябрь 1986 г.). «Простые методы оценки количества синонимичных и несинонимичных нуклеотидных замен» . Молекулярная биология и эволюция . 3 (5): 418–426. doi : 10.1093/oxfordjournals.molbev.a040410 . ПМИД 3444411 .
- Памило П., Бьянки Н.О. (март 1993 г.). «Эволюция генов Zfx и Zfy: скорость и взаимозависимость между генами» . Молекулярная биология и эволюция . 10 (2): 271–281. doi : 10.1093/oxfordjournals.molbev.a040003 . ПМИД 8487630 .
- Ян Цзы (октябрь 1997 г.). «PAML: пакет программ для филогенетического анализа по методу максимального правдоподобия» . Компьютерные приложения в биологических науках . 13 (5): 555–556. дои : 10.1093/биоинформатика/13.5.555 . ПМИД 9367129 .
- Ян З., Нильсен Р. (январь 2000 г.). «Оценка уровня синонимических и несинонимичных замен в рамках реалистичных эволюционных моделей». Молекулярная биология и эволюция . 17 (1): 32–43. doi : 10.1093/oxfordjournals.molbev.a026236 . ПМИД 10666704 .
- Чжан З, Ли Дж, Ю Дж (июнь 2006 г.). «Вычисление Ка и Кс с учетом неравных переходных замен» . Эволюционная биология BMC . 6 (1): 44. Бибкод : 2006BMCEE...6...44Z . дои : 10.1186/1471-2148-6-44 . ПМК 1552089 . ПМИД 16740169 .
- Чжан З, Ли Дж, Чжао XQ, Ван Дж, Вонг Г.К., Ю Дж (ноябрь 2006 г.). «KaKs_Calculator: расчет Ka и Ks посредством выбора модели и усреднения модели» . Геномика, протеомика и биоинформатика . 4 (4): 259–263. дои : 10.1016/S1672-0229(07)60007-2 . ПМК 5054075 . ПМИД 17531802 .