Геномное сканирование пептидных отпечатков пальцев
Сканирование пептидных отпечатков на основе генома (GFS) - это система биоинформатического анализа, которая пытается определить геномное происхождение (то есть, от какого вида они происходят) образцов белков путем сканирования их отпечатков пептидной массы по сравнению с теоретической трансляцией и протеолитическим перевариванием белков. целый геном. [1] Этот метод является улучшением по сравнению с предыдущими методами, поскольку он сравнивает пептидные отпечатки со всем геномом, а не с уже аннотированным геномом. [2] Это улучшение потенциально может улучшить аннотацию генома и идентифицировать белки с неправильными или отсутствующими аннотациями.
История и предыстория
[ редактировать ]GFS был разработан Майклом К. Гиддингсом (Университет Северной Каролины, Чапел-Хилл) и др. и выпущен в 2003 году. Гиддингс расширил алгоритмы GFS на основе более ранних идей. В 1993 году были опубликованы две статьи, объясняющие методы, используемые для идентификации белков в базах данных последовательностей. Эти методы определяли массу пептидов с помощью масс-спектрометрии , а затем использовали массу для поиска в базах данных белков для идентификации белков. [3] [4] В 1999 году была выпущена более сложная программа под названием Mascot , которая объединила три типа поиска белков/баз данных: молекулярные массы пептидов, тандемную масс-спектрометрию одного или нескольких пептидов и данные комбинации масс с аминокислотной последовательностью. [5] Недостатком этой широко используемой программы является то, что она не может обнаружить альтернативные сайты сплайсинга, которые в настоящее время не аннотированы, и обычно не может найти белки, которые не были аннотированы. Гиддингс использовал эти источники для создания GFS, которая будет сравнивать данные о массе пептидов с целыми геномами для идентификации белков. Система Гиддингса способна находить новые аннотации генов, которые еще не были обнаружены, например, недокументированные гены и недокументированные альтернативные сайты сплайсинга.
Примеры исследований
[ редактировать ]В 2012 году было опубликовано исследование, в котором в модельном организме были обнаружены гены и белки, которые невозможно было найти без GFS, поскольку они ранее не были аннотированы. Планарий Schmidtea mediterranea используется в исследованиях более 100 лет. Эта планарий способна регенерировать недостающие части тела и поэтому становится потенциальным модельным организмом для исследований стволовых клеток. Планарии покрыты слизью, которая помогает им передвигаться, защищает их от хищников и помогает их иммунной системе. Геном Schmidtea mediterranea секвенирован, но в основном не аннотирован, что делает его главным кандидатом для сканирования пептидных отпечатков пальцев на основе генома. При анализе белков с помощью GFS было идентифицировано 1604 белка. Эти белки по большей части не были аннотированы до того, как они были обнаружены с помощью GFS. Им также удалось найти слизистый субпротеом (все гены, связанные с выработкой слизи). Они обнаружили, что этот протеом консервативен у сестринских видов Schmidtea mansoni. . Слизистый субпротеом настолько консервативен, что 119 ортологов у человека обнаружено планарий. Благодаря сходству этих генов планарий теперь можно использовать в качестве модели для изучения функции белков слизистой оболочки у человека. Это актуально для инфекций и заболеваний, связанных с аномалиями слизистой оболочки, таких как муковисцидоз , астма и другие заболевания легких. Эти гены не могли быть обнаружены без GFS, поскольку они ранее не были аннотированы. [6]
было проведено исследование протеогеномного картирования В феврале 2013 года с помощью ENCODE для выявления областей трансляции в геноме человека. Они применили сканирование пептидных отпечатков пальцев и MASCOT к данным о белках, чтобы найти области, которые, возможно, ранее не были аннотированы как транслированные в геноме человека. Этот поиск по всему геному показал, что примерно 4% обнаруженных ими уникальных пептидов находились за пределами ранее аннотированных областей. Кроме того, сравнение всего генома выявило на 15% больше совпадений, чем при поиске в базе данных белков (например, MASCOT). GFS можно использовать в качестве дополнительного метода аннотации, поскольку вы можете найти новые гены или сайты сплайсинга, которые ранее не были аннотированы. Однако важно помнить, что подход всего генома, используемый GFS, может быть менее чувствительным, чем программы, которые рассматривают только аннотированные регионы. [7]
Ссылки
[ редактировать ]- ^ Гиддингс, MC; Шах, А.А.; Гестеланд, Р.; Мур, Б. (2003). «Резюме сканирования пептидных отпечатков пальцев на основе генома» . ПНАС . 100 (1): 20–25. дои : 10.1073/pnas.0136893100 . ПМК 140871 . ПМИД 12518051 .
- ^ Такеши Сугияма; Масахиро Сугимото; Масару Томита (29 октября 2006 г.). метод сканирования генома» . BMC Bioinformatics . HybGFS « : Шинода, Косаку ; гибридный / 1471-2105-7-479 ПМЦ 1643838 ПМИД 17069662 .
- ^ Хензель, WJ; ТМ Биллечи; Джей Ти Стултс; СК Вонг; С. Гримли; С. Ватанабэ (1 июня 1993 г.). «Идентификация белков из двумерных гелей путем поиска молекулярной массы пептидных фрагментов в базах данных последовательностей белков» . ПНАС . 90 (11): 5011–5015. Бибкод : 1993PNAS...90.5011H . дои : 10.1073/pnas.90.11.5011 . ПМК 46643 . ПМИД 8506346 .
- ^ Манн, Маттеис; Питер Хойруп; Питер Ропсторфф (июнь 1993 г.). «Использование масс-спектрометрической информации о молекулярной массе для идентификации белков в базах данных последовательностей». Биологическая масс-спектрометрия . 22 (6): 338–345. дои : 10.1002/bms.1200220605 . ПМИД 8329463 .
- ^ Перкинс, Дэвид Н.; Дэррил Дж. К. Паппин; Дэвид М. Кризи; Джон С. Коттрелл (1 декабря 1999 г.). «Вероятностная идентификация белков путем поиска в базах данных последовательностей с использованием данных масс-спектрометрии». Электрофорез . 20 (18): 3551–3567. doi : 10.1002/(sici)1522-2683(19991201)20:18<3551::aid-elps3551>3.0.co;2-2 . ПМИД 10612281 .
- ^ Бокчинфузо, Дональд Г. (сентябрь 2012 г.). «Протеомное профилирование планарии Schmidtea mediterranea и ее слизистой выявило сходство с выделениями человека и выделениями, предсказанными для паразитических плоских червей» . Молекулярная и клеточная протеомика . 11 (9): 681–91. дои : 10.1074/mcp.M112.019026 . ПМЦ 3434776 . ПМИД 22653920 .
- ^ Хатун, Джайнаб (февраль 2013 г.). «Протеогеномное картирование всего человеческого генома для данных клеточной линии ENCODE: идентификация областей, кодирующих белок» . БМК Геномика . 14 :141. дои : 10.1186/1471-2164-14-141 . ПМК 3607840 . ПМИД 23448259 .
Внешние ссылки
[ редактировать ]- Документация по геномному пептидному сканированию отпечатков пальцев (GFS)
- Ссылка на Facebook на «Сканирование пептидных отпечатков пальцев на основе генома»
- Объяснение MS/MS по отношению к MASCOT