Структурная геномика
Структурная геномика стремится описать трехмерную структуру каждого белка, кодируемого данным геномом . Этот основанный на геноме подход позволяет использовать высокопроизводительный метод определения структуры за счет сочетания экспериментальных и модельных подходов . Принципиальное различие между структурной геномикой и традиционным структурным предсказанием заключается в том, что структурная геномика пытается определить структуру каждого белка, кодируемого геномом, а не сосредотачивается на одном конкретном белке. При наличии полногеномных последовательностей прогнозирование структуры можно выполнять быстрее за счет сочетания экспериментальных и модельных подходов, особенно потому, что наличие большого количества секвенированных геномов и ранее решенных белковых структур позволяет ученым моделировать структуру белка на основе ранее решенных структур. гомологи.
Поскольку структура белка тесно связана с функцией белка, структурная геномика может дать информацию о функциях белка. Помимо выяснения функций белков, структурная геномика может использоваться для идентификации новых белковых складок и потенциальных мишеней для открытия лекарств. Структурная геномика включает в себя использование большого количества подходов к определению структуры, включая экспериментальные методы с использованием геномных последовательностей или подходы, основанные на моделировании, основанные на последовательности или структурной гомологии с белком известной структуры или основанные на химических и физических принципах для белка, не имеющего гомологии с белком известной структуры. любая известная структура.
В отличие от традиционной структурной биологии , определение структуры белка с помощью структурной геномики часто (но не всегда) происходит до того, как становится известно что-либо о функции белка. Это ставит новые задачи в структурной биоинформатике , т.е. определение функции белка по его трехмерной структуре.
Структурная геномика уделяет особое внимание высокопроизводительному определению белковых структур. Это осуществляется в специализированных центрах структурной геномики .
В то время как большинство структурных биологов изучают структуры отдельных белков или групп белков, специалисты по структурной геномике изучают структуры белков в масштабе всего генома. Это подразумевает крупномасштабное клонирование, экспрессию и очистку. Одним из главных преимуществ этого подхода является экономия за счет масштаба. С другой стороны, научная ценность некоторых полученных структур порой подвергается сомнению. В статье Science за январь 2006 г. анализируется область структурной геномики. [ 1 ]
Одним из преимуществ структурной геномики, такой как Инициатива по структуре белка , является то, что научное сообщество получает немедленный доступ к новым структурам, а также к таким реагентам, как клоны и белки. Недостатком является то, что многие из этих структур представляют собой белки с неизвестной функцией и не имеют соответствующих публикаций. Это требует новых способов передачи этой структурной информации более широкому исследовательскому сообществу. Ядро биоинформатики Объединенного центра структурной геномики (JCSG) недавно разработало подход на основе вики, а именно сеть аннотаций открытой структуры белка (TOPSAN), для аннотирования белковых структур, возникающих в высокопроизводительных центрах структурной геномики.
Цели
[ редактировать ]Одной из целей структурной геномики является выявление новых белковых складок. Экспериментальные методы определения структуры белка требуют белков, которые хорошо экспрессируются и/или кристаллизуются, что может по своей сути искажать типы складок белков, которые проясняют эти экспериментальные данные. Геномный подход, основанный на моделировании, такой как ab initio, моделирование может лучше идентифицировать новые складки белка, чем экспериментальные подходы, поскольку они не ограничены экспериментальными ограничениями.
Функция белка зависит от трехмерной структуры, и эти трехмерные структуры более консервативны, чем последовательности . Таким образом, высокопроизводительные методы определения структуры структурной геномики могут помочь нам лучше понять функции белков. Это также имеет потенциальные последствия для открытия лекарств и белковой инженерии. [ 2 ] Более того, каждый белок, добавляемый в структурную базу данных, увеличивает вероятность того, что база данных будет включать гомологичные последовательности других неизвестных белков. Инициатива по структуре белка (PSI) — это многогранная работа, финансируемая Национальными институтами здравоохранения совместно с различными академическими и промышленными партнерами, целью которой является расширение знаний о структуре белка с использованием подхода структурной геномики и улучшение методологии определения структуры.
Методы
[ редактировать ]Структурная геномика использует преимущества завершенных последовательностей генома несколькими способами для определения структур белков. Последовательность гена целевого белка также можно сравнить с известной последовательностью, а затем получить структурную информацию на основе структуры известного белка. Структурная геномика может использоваться для прогнозирования новых складок белка на основе других структурных данных. Структурная геномика также может использовать подход, основанный на моделировании, основанный на гомологии между неизвестным белком и решенной структурой белка.
снова методы
[ редактировать ]Завершенные последовательности генома позволяют каждую открытую рамку считывания (ORF), часть гена, которая, вероятно, содержит последовательность информационной РНК клонировать и экспрессировать в виде белка и белка. Эти белки затем очищают и кристаллизуют, а затем подвергают одному из двух типов определения структуры: рентгеновской кристаллографии и ядерного магнитного резонанса (ЯМР). Полная последовательность генома позволяет создать каждый праймер, необходимый для амплификации всех ORF, клонирования их в бактерии и последующей экспрессии. Используя полногеномный подход к этому традиционному методу определения структуры белка, все белки, кодируемые геномом, могут быть экспрессированы одновременно. Этот подход позволяет определить структуру каждого белка, кодируемого геномом.
Методы, основанные на моделировании
[ редактировать ]с нуля моделирование
[ редактировать ]Этот подход использует данные о последовательностях белков, а также химические и физические взаимодействия кодируемых аминокислот для прогнозирования трехмерных структур белков, не имеющих гомологии с решенными белковыми структурами. Одним из весьма успешных методов моделирования ab initio является программа Rosetta , которая делит белок на короткие сегменты и преобразует короткую полипептидную цепь в низкоэнергетическую локальную конформацию. Rosetta доступна для коммерческого и некоммерческого использования через общедоступную программу Robetta.
Последовательное моделирование
[ редактировать ]Этот метод моделирования сравнивает последовательность гена неизвестного белка с последовательностями белков с известной структурой. В зависимости от степени сходства последовательностей структура известного белка может быть использована в качестве модели для решения структуры неизвестного белка. Считается, что для высокоточного моделирования требуется не менее 50% идентичности аминокислотных последовательностей неизвестного белка и решенной структуры. Идентичность последовательностей на 30-50% дает модель средней точности, а идентичность последовательностей ниже 30% дает модели низкой точности. Было предсказано, что необходимо будет определить не менее 16 000 белковых структур, чтобы все структурные мотивы были представлены хотя бы один раз и, таким образом, позволили точно решить структуру любого неизвестного белка посредством моделирования. [ 3 ] Однако одним из недостатков этого метода является то, что структура более консервативна, чем последовательность, и поэтому моделирование на основе последовательностей может быть не самым точным способом прогнозирования белковых структур.
Резьба
[ редактировать ]В основе структурного моделирования потоков лежит сходство складок, а не идентичность последовательностей. Этот метод может помочь идентифицировать отдаленно родственные белки и использоваться для определения молекулярных функций.
Примеры структурной геномики
[ редактировать ]В настоящее время предпринимаются попытки определить структуру каждого белка в данном протеоме.
Thermotoga maritima Протеом
[ редактировать ]Одной из текущих целей Объединенного центра структурной геномики (JCSG), входящего в Инициативу по структуре белков (PSI), является определение структур всех белков Thermotoga maritima , термофильной бактерии. T. maritima была выбрана в качестве мишени структурной геномики на основании ее относительно небольшого генома, состоящего из 1877 генов, и гипотезы о том, что белки, экспрессируемые термофильными бактериями, легче кристаллизоваться.
Лесли и др. использовали Escherichia coli для экспрессии всех открытых рамок считывания (ORF) T. martima . Затем эти белки кристаллизовали, и структуру успешно кристаллизованных белков определяли с помощью рентгеновской кристаллографии. Среди других структур этот подход структурной геномики позволил определить структуру белка TM0449, который, как было обнаружено, демонстрирует новую укладку, поскольку не имеет структурной гомологии ни с одним известным белком. [ 4 ]
микобактерии туберкулеза Протеом
[ редактировать ]Цель Консорциума структурной геномики туберкулеза — определить структуры потенциальных мишеней для лекарств в микобактерии туберкулеза , бактерии, вызывающей туберкулез. Разработка новых лекарственных средств против туберкулеза особенно важна, учитывая растущую проблему туберкулеза с множественной лекарственной устойчивостью .
Полностью секвенированный геном M.tuberculosis позволил ученым клонировать многие из этих белков-мишеней в векторы экспрессии для очистки и определения структуры с помощью рентгеновской кристаллографии. Исследования выявили ряд белков-мишеней для определения структуры, включая внеклеточные белки, которые могут быть вовлечены в патогенез, белки, регулирующие железо, текущие мишени для лекарств и белки, которые, по прогнозам, будут иметь новые складки. На данный момент определены структуры 708 белков, кодируемых M.tuberculosis .
Базы данных и классификации белковых структур
[ редактировать ]- Банк данных белков (PDB): хранилище информации о последовательностях белков и структурной информации.
- UniProt : предоставляет информацию о последовательности и функциях.
- Структурная классификация белков (классификации SCOP): иерархический подход
- Класс, архитектура, топология и гомологическое суперсемейство (CATH): иерархический подход
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Чандония Дж. М., Бреннер С. Е. (январь 2006 г.). «Влияние структурной геномики: ожидания и результаты» . Наука . 311 (5759): 347–51. Бибкод : 2006Sci...311..347C . дои : 10.1126/science.1121018 . ПМИД 16424331 . S2CID 800902 .
- ^ Кун П., Уилсон К., Патч М.Г., Стивенс Р.К. (октябрь 2002 г.). «Происхождение высокопроизводительного открытия лекарств на основе структуры с использованием кристаллографии белков». Curr Opin Chem Biol . 6 (5): 704–10. дои : 10.1016/S1367-5931(02)00361-7 . ПМИД 12413557 .
- ^ Бейкер Д., Сали А. (октябрь 2001 г.). «Предсказание структуры белка и структурная геномика». Наука . 294 (5540): 93–6. Бибкод : 2001Sci...294...93B . дои : 10.1126/science.1065659 . ПМИД 11588250 . S2CID 7193705 .
- ^ Лесли С.А., Кун П., Годзик А. и др. (сентябрь 2002 г.). «Структурная геномика протеома Thermotoga maritima, реализованная в высокопроизводительном конвейере определения структуры» . Учеб. Натл. акад. наук. США . 99 (18): 11664–9. Бибкод : 2002PNAS...9911664L . дои : 10.1073/pnas.142413399 . ПМК 129326 . ПМИД 12193646 .
Дальнейшее чтение
[ редактировать ]- Хофт Р.В., Вриенд Дж., Сандер С., Абола Э.Э. (май 1996 г.). «Ошибки в белковых структурах» . Природа . 381 (6580): 272. Бибкод : 1996Natur.381..272H . дои : 10.1038/381272a0 . ПМИД 8692262 . S2CID 4368507 .
- Марсден Р.Л., Льюис Т.А., Оренго, Калифорния (2007). «На пути к всестороннему структурному охвату завершенных геномов: точка зрения структурной геномики» . БМК Биоинформатика . 8:86 . дои : 10.1186/1471-2105-8-86 . ПМК 1829165 . ПМИД 17349043 .
- Бейкер Э.Н., Аркус В.Л., Лотт Дж.С. (2003). «Предсказание и анализ структуры белка как инструмент функциональной геномики» . Прил. Биоинформ . 2 (3 дополнения): С3–10. ПМИД 15130810 .
- Гулдинг К.В., Перри Л.Дж., Андерсон Д. и др. (сентябрь 2003 г.). «Структурная геномика микобактерий туберкулеза: предварительный отчет о прогрессе в Калифорнийском университете в Лос-Анджелесе». Биофиз. Хим . 105 (2–3): 361–70. CiteSeerX 10.1.1.318.7988 . дои : 10.1016/S0301-4622(03)00101-7 . ПМИД 14499904 .
- Сколник Дж., Фетроу Дж.С., Колински А. (март 2000 г.). «Структурная геномика и ее значение для анализа функций генов». Нат. Биотехнология . 18 (3): 283–7. дои : 10.1038/73723 . ПМИД 10700142 . S2CID 2723601 .