Jump to content

Проект анатомии генома рака

Проект анатомии генома рака ( CGAP ), созданный Национальным институтом рака (NCI) в 1997 году и представленный Элом Гором , представляет собой онлайн-базу данных о нормальных, предраковых и раковых геномах. Он также предоставляет инструменты для просмотра и анализа данных, позволяющие идентифицировать гены, участвующие в различных аспектах прогрессирования опухоли. Цель CGAP — охарактеризовать рак на молекулярном уровне, предоставив платформу с легкодоступными обновленными данными и набором инструментов, позволяющих исследователям легко соотносить свои результаты с существующими знаниями. Также уделяется внимание разработке программных инструментов, которые улучшают использование больших и сложных наборов данных. [ 1 ] [ 2 ] Проектом руководит Даниэла С. Герхард, и он включает в себя подпроекты или инициативы, в том числе Проект по раковым хромосомным аберрациям (CCAP) и Инициативу по генетическим аннотациям (GAI). CGAP вносит свой вклад во многие базы данных, а такие организации, как NCBI, вносят свой вклад в базы данных CGAP.

Конечные результаты CGAP включают установление корреляции между прогрессированием конкретного рака и его терапевтическим результатом, улучшение оценки лечения и разработку новых методов профилактики, обнаружения и лечения. Это достигается путем характеристики продуктов мРНК биологических тканей.

Исследовать

[ редактировать ]

Фундаментальной причиной рака является неспособность клетки регулировать экспрессию своих генов. Чтобы охарактеризовать конкретный тип рака, можно исследовать белки, которые образуются в результате измененной экспрессии генов, или предшественника мРНК белка. конкретной клетки CGAP работает, чтобы связать профиль экспрессии , молекулярную сигнатуру или транскриптом , который, по сути, является отпечатком пальца клетки, с фенотипом клетки. Следовательно, существуют профили экспрессии с учетом типа рака и стадии прогрессирования. [ 3 ]

Секвенирование

[ редактировать ]

Первоначальной целью CGAP было создание индекса генов опухолей (TGI) для хранения профилей экспрессии. Это внесет вклад как в новые, так и в существующие базы данных. [ 4 ] Это способствовало появлению двух типов библиотек: dbEST и более поздней версии dbSAGE. Это было выполнено в несколько этапов: [ 3 ]

  • Содержимое клеток промывают планшеты с поли-Т-последовательностями. Это свяжет хвосты Poly-A , которые существуют только на молекулах мРНК, тем самым избирательно сохраняя мРНК.
  • Выделенная мРНК преобразуется в транскрипт кДНК посредством реакций обратной транскрипции и полимеризации ДНК.
  • Полученную двухцепочечную ДНК затем включают в E.coli плазмиды . Каждая бактерия теперь содержит одну уникальную кДНК и реплицируется для создания клонов с той же генетической информацией. Это называется библиотекой кДНК .
  • Затем библиотеку можно секвенировать с помощью методов высокопроизводительного секвенирования . Это может характеризовать как различные гены, экспрессируемые исходной клеткой, так и степень экспрессии каждого гена.

TGI сначала сосредоточил свое внимание на раке простаты, молочной железы, яичников, легких и толстой кишки, а CGAP в своих исследованиях распространил свою деятельность на другие виды рака. На практике возникли проблемы, которые CGAP приняла во внимание по мере появления новых технологий.

Многие виды рака возникают в тканях с несколькими типами клеток. Традиционные методы брали образец всей ткани и создавали объемные библиотеки кДНК тканей. Эта клеточная гетерогенность сделала информацию об экспрессии генов с точки зрения биологии рака менее точной. Примером является ткань рака простаты, где эпителиальные клетки, которые, как было показано, являются единственным типом клеток, вызывающим рак, составляют только 10% от общего числа клеток. Это привело к разработке микродиссекции с лазерным захватом (LCM), метода, который может изолировать отдельные типы клеток, что привело к созданию библиотек кДНК конкретных типов клеток. [ 4 ]

Секвенирование кДНК позволит получить полный транскрипт мРНК, который ее сгенерировал. На практике для однозначной идентификации связанной мРНК или белка требуется только часть последовательности. Полученная часть последовательности была названа меткой экспрессируемой последовательности (EST) и всегда находится в конце последовательности, близком к хвосту поли-А. Данные EST хранятся в базе данных dbEST. Длина EST должна составлять всего около 400 оснований, но при использовании методов секвенирования NGS это все равно приведет к считыванию низкого качества. улучшенный метод, называемый серийным анализом экспрессии генов Поэтому также используется (SAGE). Этот метод идентифицирует для каждой молекулы транскрипта кДНК, полученной в результате экспрессии гена клетки, области длиной всего 10-14 оснований в любом месте считываемой последовательности, достаточные для уникальной идентификации этого транскрипта кДНК. Эти основания вырезаются и соединяются вместе, а затем включаются в бактериальные плазмиды, как упоминалось выше. Библиотеки SAGE имеют лучшее качество чтения и генерируют больший объем данных при секвенировании, а поскольку транскрипты сравниваются на абсолютных, а не относительных уровнях, SAGE имеет то преимущество, что не требует нормализации данных путем сравнения с эталоном. [ 1 ] [ 4 ]

После секвенирования и создания библиотек CGAP объединяет данные вместе с существующими источниками данных и предоставляет различные базы данных и инструменты для анализа. Подробное описание инструментов и баз данных, созданных или используемых CGAP, можно найти на веб-сайте CGAP NCI. Ниже приведены некоторые инициативы или исследовательские инструменты, предоставленные CGAP.

Инициатива по геномной аннотации

[ редактировать ]

Целью Инициативы по аннотации генома проекта анатомии ракового генома (CGAP-GAI) является обнаружение и каталогизация однонуклеотидных полиморфизмов (SNP), которые коррелируют с возникновением и прогрессированием рака. [ 4 ] CGAP-GAI создала множество инструментов для обнаружения, анализа и отображения SNP. SNP ценны в исследованиях рака, поскольку их можно использовать в нескольких различных генетических исследованиях, обычно для отслеживания передачи, идентификации альтернативных форм генов и анализа сложных молекулярных путей, которые регулируют клеточный метаболизм, рост или дифференцировку. [ 5 ]

SNP в CGAP-GAI обнаруживаются либо в результате повторного секвенирования интересующих генов у разных людей, либо в результате просмотра существующих баз данных EST человека и проведения сравнений. [ 2 ] Он исследует транскрипты здоровых людей, людей с заболеваниями, опухолевых тканей и клеточных линий от большого количества людей; поэтому база данных с большей вероятностью будет включать в себя редкие мутации заболеваний в дополнение к высокочастотным вариантам. [ 6 ] Общей проблемой при обнаружении SNP является дифференциация ошибок секвенирования с реальными полиморфизмами. Обнаруженные SNP подвергаются статистическому анализу с использованием конвейера SNP CGAP для расчета вероятности того, что вариант на самом деле является полиморфизмом. SNP с высокой вероятностью проверены, и существуют инструменты, которые позволяют прогнозировать, будет ли изменена функция. [ 2 ]

Чтобы сделать данные легко доступными, CGAP-GAI имеет ряд инструментов, которые могут отображать как выравнивание последовательностей, так и обзор сборки с контекстом последовательностей, на основе которых они были предсказаны. SNP аннотируются и часто определяются интегрированные генетические/физические карты. [ 6 ]

Проект по изучению хромосомных аберраций рака (CCAP)

[ редактировать ]

Геномная нестабильность является общей чертой рака; поэтому понимание структурных и хромосомных аномалий может дать представление о прогрессировании заболевания. Проект раковых хромосомных аберраций (cCAP) — это инициатива, поддерживаемая CGAP, используемая для определения структуры хромосом и характеристики перестроек, связанных со злокачественной трансформацией. [ 4 ] [ 7 ] Он включает в себя онлайн-версию базы данных Мительмана, созданную Феликсом Мительманом, Бертилом Йоханссоном и Фредриком Мертенсом до создания CGAP, еще одного сборника известных хромосомных перестроек. CCAP преследует несколько целей: [ 7 ]

  • Интеграция цитогенетических и физических карт генома человека
  • Создать хранилище клонов BAC по всему геному, которые генетически и физически картированы.
  • Разработать платформу для параллельной корреляции баз данных аберраций, связанных с раком (база данных клонов BAC, сопоставленных с помощью флуоресцентной гибридизации in-situ (FISH))
  • Интеграция трех методов цитогенетического анализа (спектральное кариотипирование, сравнительная гибридизация генома и FISH) для уточнения определяющей номенклатуры кариотипических аберраций.

В базе данных содержится цитогенетическая информация о более чем 64 000 случаев заболевания пациентов, включая более 2000 слияний генов. [ 1 ]

В рамках этого проекта существует хранилище физически и цитогенетически картированных клонов BAC генома человека, которые физически доступны через сеть дистрибьюторов. [ 1 ] Карты клонов CCAP были картированы цитогенетически с использованием FISH с разрешением 1-2 МБ по всему геному человека и физически картированы с использованием сайтов с мечеными последовательностями (STS). [ 8 ] Данные о клонах BAC также доступны в базах данных CGAP и NCBI.

Другие ресурсы

[ редактировать ]

Ниже перечислены некоторые другие ресурсы, доступные через CGAP. [ 1 ]

Цифровой дифференциальный дисплей

[ редактировать ]

Ранним методом, используемым CGAP, является цифровое дифференциальное отображение (DDD), которое использует точный критерий Фишера для сравнения библиотек друг с другом, чтобы найти значительную разницу между популяциями. CGAP гарантировал, что DDD сможет сравнивать все библиотеки кДНК в dbEST, а не только те, которые были созданы CGAP. [ 4 ]

Коллекция генов млекопитающих (MGC)

[ редактировать ]

MGC предоставляет исследователям полную информацию о белках из кДНК, в отличие от баз данных EST или SAGE, которые предоставляют только идентификационную метку. В проект включены гены человека и мыши, а позже были добавлены кДНК коров, созданные Genome Canada . [ 9 ]

Карта SAGE

[ редактировать ]

SAGEmap — это база данных, используемая для хранения библиотек SAGE. По состоянию на 2001 год существует более 3,4 миллиона тегов SAGE. Можно использовать инструменты для сопоставления тегов SAGE с кластерами UniGene , базой данных, в которой хранятся транскриптомы. Это позволяет упростить идентификацию соответствующей последовательности тега SAGE. Кроме того, существуют инструменты, связанные с SAGEmaps: [ 10 ]

  • Digital Northern используется для измерения уровня экспрессии определенных генов. [ 1 ]
  • SAGE Anatomic Viewer визуально отображает эту информацию и сравнивает ее между нормальными и раковыми клетками.
  • Программа просмотра Ludwig Transcript (LT) показывает альтернативные транскрипты и возможные связанные с ними теги SAGE.
  • Матрица экспрессии mSAGE (mSEM) показывает уровни экспрессии генов на протяжении всего развития мыши для различных типов тканей.

Искатель генов

[ редактировать ]

CGAP находит ген или список генов на основе заданных критериев поиска и предоставляет ссылки на различные базы данных NCI и NCBI. Ген можно искать конкретно с использованием уникального идентификатора, такого как символы гена и номер гена Entrez, а также, как правило, по функции, ткани или ключевому слову. [ 11 ]

Другие генные инструменты, доступные через веб-интерфейс CGAP, включают браузер Gene Ontology (GO) и инструмент Nucleotide BLAST.

Инструменты экспрессии генов

[ редактировать ]

cDNA xProfiler и цифровой дисплей экспрессии генов кДНК (DGED) вместе используются для поиска статистически значимых представляющих интерес генов, которые дифференциально экспрессируются в двух пулах библиотек кДНК, обычно проводится сравнение между нормальными и раковыми тканями. [ 12 ] Статистическая значимость определяется DGED с использованием комбинации байесовской статистики и отношения шансов последовательности для расчета вероятности. cDNA DGED опирается на реляционную базу данных UniGene, тогда как cDNA xProfiler использует базу данных с плоскими файлами, которая недоступна в Интернете. [ 13 ]

Результаты и будущее

[ редактировать ]

CGAP в настоящее время является централизованным хранилищем нескольких инструментов геномики и генетических баз данных и широко используется в исследованиях рака и молекулярной биологии. Базы данных, созданные CGAP, продолжают вносить вклад в знание раковых заболеваний с точки зрения их путей и прогрессирования. Базы данных транскриптомов также можно использовать в исследованиях, не связанных с раком, поскольку они содержат информацию, которую можно использовать для быстрой и простой идентификации конкретных секвенированных генов. Эти данные также имеют клиническое значение, поскольку кДНК можно использовать для создания микрочипов для диагностики и сравнения методов лечения. CGAP использовался во многих исследованиях, в том числе: [ 1 ] [ 4 ]

  • Характеристика различий в экспрессии генов нормальных и раковых эндотелиальных клеток [ 14 ]
  • Выявление нерегулярной экспрессии генов как маркеров глиобластомы [ 15 ] и рак яичников [ 16 ]
  • Выявление экспрессии генов, специфичных для ткани простаты [ 17 ]
  • Сравнение белков, экспрессируемых в нормальной и раковой репродуктивной ткани [ 18 ]

Кроме того, огромный объем данных, генерируемых CGAP, побудил к совершенствованию методов анализа и анализа данных, в том числе: [ 1 ]

  • Сравнение экспрессии генов из нескольких библиотек кДНК [ 19 ]
  • Улучшенные методы анализа библиотек EST. [ 20 ]
  • Комплексные крупномасштабные исследования анализа транскриптома человека [ 21 ]

См. также

[ редактировать ]
  1. ^ Перейти обратно: а б с д и ж г час Риггинс, Дж.Дж. (2001). «Геном и генетические ресурсы из проекта анатомии генома рака». Молекулярная генетика человека . 10 (7): 663–667. дои : 10.1093/хмг/10.7.663 . ISSN   1460-2083 . ПМИД   11257097 .
  2. ^ Перейти обратно: а б с Штраусберг, Роберт Л.; Бьютоу, Кеннет Х.; Эммерт-Бак, Майкл Р.; Клаузнер, Ричард Д. (2000). «Проект анатомии генома рака: создание аннотированного индекса генов». Тенденции в генетике . 16 (3): 103–106. дои : 10.1016/S0168-9525(99)01937-X . ISSN   0168-9525 . ПМИД   10689348 .
  3. ^ Перейти обратно: а б «Понимание рака» . Архивировано из оригинала 5 августа 2014 г. Проверено 4 сентября 2014 г.
  4. ^ Перейти обратно: а б с д и ж г Крисман, Дэвид Б.; Вагнер, Лукас; Лэш, Алекс; Штраусберг, Роберт Л.; Эммерт-Бак, Майкл Р. (1999). «Проект анатомии генома рака: секвенирование EST и генетика прогрессирования рака» . Неоплазия . 1 (2): 101–106. дои : 10.1038/sj.neo.7900002 . ISSN   1476-5586 . ПМК   1508126 . ПМИД   10933042 .
  5. ^ Клиффорд, Р. (2000). «Генетические/физические карты однонуклеотидных полиморфизмов, основанные на экспрессии, выявленные в рамках проекта анатомии генома рака» . Геномные исследования . 10 (8): 1259–1265. дои : 10.1101/гр.10.8.1259 . ISSN   1088-9051 . ПМК   310932 . ПМИД   10958644 .
  6. ^ Перейти обратно: а б Клиффорд, Роберт Дж.; Эдмонсон, Майкл Н.; Нгуен, Ку; Шерпбье, Титиа; Ху, Ин; Бьютоу, Кеннет Х. (2004). «Инструменты биоинформатики для обнаружения и анализа полиморфизма одиночных нуклеотидов». Анналы Нью-Йоркской академии наук . 1020 (1): 101–109. Бибкод : 2004NYASA1020..101C . дои : 10.1196/анналы.1310.011 . ISSN   0077-8923 . ПМИД   15208187 . S2CID   19088027 .
  7. ^ Перейти обратно: а б «Проект раковых хромосомных аберраций (CCAP)» . Проверено 5 сентября 2014 г.
  8. ^ «Все о BAC, нанесенных на карту FISH» . Проверено 7 сентября 2014 г.
  9. ^ «Коллекция генов млекопитающих» . Архивировано из оригинала 25 февраля 2015 г. Проверено 7 сентября 2014 г.
  10. ^ «джинн МУДРЕЦ» . Проверено 7 сентября 2014 г.
  11. ^ «Искатель генов» . Проверено 7 сентября 2014 г.
  12. ^ «Практическое руководство по CGAP: инструменты» . Проверено 7 сентября 2014 г.
  13. ^ Милнторп, Эндрю Т; Соловьев, Михаил (2011). «Ошибки в CGAP xProfiler и кДНК DGED: важность алгоритмов анализа библиотек и выбора генов» . БМК Биоинформатика . 12 (1): 97. дои : 10.1186/1471-2105-12-97 . ISSN   1471-2105 . ПМК   3094240 . ПМИД   21496233 .
  14. ^ Круа, Б. Ст. (2000). «Гены, экспрессируемые в эндотелии опухолей человека». Наука . 289 (5482): 1197–1202. Бибкод : 2000Sci...289.1197S . дои : 10.1126/science.289.5482.1197 . ISSN   0036-8075 . ПМИД   10947988 .
  15. ^ Ведение журнала, WT (2000). «Идентификация потенциальных опухолевых маркеров и антигенов путем анализа баз данных и быстрого скрининга экспрессии» . Геномные исследования . 10 (9): 1393–1402. дои : 10.1101/гр.138000 . ISSN   1088-9051 . ПМК   310902 . ПМИД   10984457 .
  16. ^ CD Хаф; CA Шерман-Бауст; Э.С. Пайзер; Ф. Дж. Монц; ДД Им; Н. Б. Розеншейн; КР Чо; Дж. Дж. Риггинс; П. Дж. Морин (ноябрь 2000 г.). «Крупномасштабный серийный анализ экспрессии генов выявляет гены, дифференциально экспрессирующиеся при раке яичников». Исследования рака . 60 (22): 6281–6287. ПМИД   11103784 .
  17. ^ Г. Васматзис; М. Эссан; У. Бринкманн; Б. Ли; И. Пастан (январь 1998 г.). «Обнаружение трех генов, специфически экспрессирующихся в простате человека, путем анализа базы данных экспрессируемых последовательностей» . Труды Национальной академии наук Соединенных Штатов Америки . 95 (1): 300–304. Бибкод : 1998PNAS...95..300В . дои : 10.1073/pnas.95.1.300 . ПМК   18207 . ПМИД   9419370 .
  18. ^ У. Бринкманн; Г. Васматзис; Б. Ли; Н. Йерушалми; М. Эссан; И. Пастан (сентябрь 1998 г.). «PAGE-1, GAGE-подобный ген, связанный с Х-хромосомой, который экспрессируется в нормальной и неопластической предстательной железе, яичках и матке» . Труды Национальной академии наук Соединенных Штатов Америки . 95 (18): 10757–10762. Бибкод : 1998PNAS...9510757B . дои : 10.1073/pnas.95.18.10757 . ПМК   27968 . ПМИД   9724777 .
  19. ^ DJ Стекел; Ю. Гит; Ф. Фальчиани (декабрь 2000 г.). «Сравнение экспрессии генов из нескольких библиотек кДНК» . Геномные исследования . 10 (12): 2055–2061. дои : 10.1101/gr.gr-1325rr . ПМК   313085 . ПМИД   11116099 .
  20. ^ Шмитт, АО; Шпехт, Т.; Бекманн, Г.; Даль, Э.; Пиларский, К.П.; Хинцманн, Б.; Розенталь, А. (1999). «Исчерпывающий анализ библиотек EST для генов, дифференциально экспрессирующихся в нормальных и опухолевых тканях» . Исследования нуклеиновых кислот . 27 (21): 4251–4260. дои : 10.1093/нар/27.21.4251 . ISSN   0305-1048 . ПМК   148701 . ПМИД   10518618 .
  21. ^ В.Е. Велкулеску; С.Л. Мэдден; Л. Чжан; А.Э. Лэш; Дж. Ты; К. Раго; А. Кинг; Си Джей Ван; Г.А. Бодри; К.М. Чириелло; Б.П. Кук; г-н Дюфо; АТ Фергюсон; Ю. Гао; ТЦ Он; Х. Хермекинг; СК Вестник; Премьер-министр Хван; М. А. Лопес; Х. Ф. Людерер; Б. Мэтьюз; Дж. М. Петрозиелло; К. Поляк; Л. Завель; К.В. Кинцлер (декабрь 1999 г.). «Анализ транскриптомов человека». Природная генетика . 23 (4): 387–388. дои : 10.1038/70487 . ПМИД   10581018 . S2CID   29173492 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 4172f8f2263f791323924f279367a1c9__1706280840
URL1:https://arc.ask3.ru/arc/aa/41/c9/4172f8f2263f791323924f279367a1c9.html
Заголовок, (Title) документа по адресу, URL1:
Cancer Genome Anatomy Project - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)