Профилирование экспрессии генов

Тепловые карты значений экспрессии генов показывают, как экспериментальные условия повлияли на продукцию (экспрессию) мРНК для набора генов. Зеленый цвет указывает на снижение экспрессии. Кластерный анализ поместил группу генов с пониженной регуляцией в верхнем левом углу.

В области молекулярной биологии профилирование экспрессии генов — это измерение активности ( экспрессии ) тысяч генов одновременно для создания глобальной картины клеточных функций. Эти профили могут, например, различать активно делящиеся клетки или показывать, как клетки реагируют на определенное лечение. Во многих экспериментах такого рода одновременно измеряется весь геном , то есть каждый ген, присутствующий в конкретной клетке.

несколько технологий транскриптомики Для получения необходимых данных для анализа можно использовать . ДНК-микрочипы ^[1] измерить относительную активность ранее идентифицированных генов-мишеней. Методы, основанные на секвенировании, такие как RNA-Seq , предоставляют информацию о последовательностях генов в дополнение к уровню их экспрессии.

Фон

Профилирование экспрессии является логическим следующим шагом после секвенирования генома : последовательность говорит нам, что может делать клетка, а профиль экспрессии говорит нам, что она на самом деле делает в определенный момент времени. Гены содержат инструкции по созданию информационной РНК ( мРНК ), но в любой момент каждая клетка производит мРНК только из части генов, которые она несет. Если ген используется для производства мРНК, он считается «включенным», в противном случае — «выключенным». Многие факторы определяют, включен или выключен ген, например, время суток, активно ли делится клетка, ее местное окружение и химические сигналы от других клеток. Например, клетки кожи , печени и нервные клетки включают (экспрессируют) несколько разные гены, и это во многом делает их разными. Таким образом, профиль экспрессии позволяет определить тип, состояние, среду и т. д. клетки.

Эксперименты по профилированию экспрессии часто включают измерение относительного количества мРНК, экспрессируемой в двух или более экспериментальных условиях. Это связано с тем, что измененные уровни определенной последовательности мРНК предполагают измененную потребность в белке, кодируемом мРНК, что, возможно, указывает на гомеостатический ответ или патологическое состояние. Например, более высокие уровни мРНК, кодирующей алкогольдегидрогеназу, позволяют предположить, что исследуемые клетки или ткани реагируют на повышенные уровни этанола в окружающей среде. Аналогичным образом, если клетки рака молочной железы экспрессируют более высокие уровни мРНК, связанной с определенным трансмембранным рецептором, чем нормальные клетки, возможно, этот рецептор играет роль в раке молочной железы. Препарат, который взаимодействует с этим рецептором, может предотвратить или вылечить рак молочной железы. При разработке лекарства можно провести эксперименты по профилированию экспрессии генов, чтобы помочь оценить токсичность препарата, возможно, путем поиска изменяющихся уровней экспрессии генов цитохрома P450 , которые могут быть биомаркером. метаболизма лекарств. ^[2] Профилирование экспрессии генов может стать важным диагностическим тестом. ^[3]^[4]

Сравнение с протеомикой

Геном человека содержит около 20 000 генов, которые работают согласованно, производя примерно 1 000 000 различных белков. Это связано с альтернативным сплайсингом , а также с тем, что клетки вносят важные изменения в белки посредством посттрансляционной модификации после того, как они впервые их построили, поэтому данный ген служит основой для многих возможных версий конкретного белка. В любом случае, один масс-спектрометрический эксперимент может выявить около 2000 белков ^[5] или 0,2% от общей суммы. Хотя знание точных белков, которые производит клетка ( протеомика ), более актуально, чем знание того, сколько информационной РНК производится из каждого гена, ^{[ почему? ]} Профилирование экспрессии генов дает наиболее глобальную картину, возможную в одном эксперименте. Однако методология протеомики совершенствуется. У других видов, таких как дрожжи, можно идентифицировать более 4000 белков всего за один час. ^[6]

Использование при генерации и проверке гипотез.

Иногда у ученого уже есть представление о том, что происходит, гипотеза , и он или она проводит эксперимент по профилированию выражений с идеей потенциального опровержения этой гипотезы. Другими словами, учёный делает конкретный прогноз об уровнях экспрессии, который может оказаться ложным.

Чаще всего профилирование экспрессии проводится до того, как станет известно достаточно о том, как гены взаимодействуют с экспериментальными условиями, чтобы существовала проверяемая гипотеза. При отсутствии гипотезы нечего опровергать, но профилирование выражений может помочь определить гипотезу-кандидат для будущих экспериментов. Большинство ранних экспериментов по профилированию экспрессии и многие нынешние имеют такую форму. ^[7] которое известно как открытие классов. Популярный подход к обнаружению классов включает группировку схожих генов или образцов вместе с использованием одного из многих существующих методов кластеризации, таких как традиционные k-средние или иерархическая кластеризация или более поздний MCL . ^[8] Помимо выбора алгоритма кластеризации, пользователю обычно приходится выбирать соответствующую меру близости (расстояние или сходство) между объектами данных. ^[9] На рисунке выше представлены результаты двумерного кластера, в котором похожие образцы (строки выше) и аналогичные генные зонды (столбцы) были организованы так, что они располагались близко друг к другу. Простейшей формой открытия классов было бы составление списка всех генов, которые изменились более чем на определенную величину между двумя экспериментальными условиями.

Предсказать класс сложнее, чем его открытие, но оно позволяет ответить на вопросы, имеющие прямое клиническое значение, например, какова вероятность того, что этот пациент, учитывая этот профиль, отреагирует на этот препарат? Для этого требуется множество примеров профилей, которые ответили и не ответили, а также методы перекрестной проверки, чтобы различать их.

Ограничения

В целом исследования по профилированию экспрессии сообщают о тех генах, которые показали статистически значимые различия в измененных экспериментальных условиях. Обычно это небольшая часть генома по нескольким причинам. Во-первых, разные клетки и ткани экспрессируют подмножество генов, что является прямым следствием клеточной дифференцировки, поэтому многие гены отключаются. Во-вторых, многие гены кодируют белки, необходимые для выживания, в очень специфических количествах, поэтому многие гены не изменяются. В-третьих, клетки используют множество других механизмов для регулирования белков в дополнение к изменению количества мРНК , поэтому эти гены могут постоянно экспрессироваться, даже когда концентрации белка растут и падают. В-четвертых, финансовые ограничения ограничивают эксперименты по профилированию экспрессии небольшим количеством наблюдений одного и того же гена в идентичных условиях, что снижает статистическую мощность эксперимента и делает невозможным выявление важных, но тонких изменений. Наконец, обсуждение биологического значения каждого регулируемого гена требует огромных усилий, поэтому ученые часто ограничивают свое обсуждение лишь его подмножеством. Новее Методы микроматричного анализа автоматизируют определенные аспекты придания биологической значимости результатам профилирования экспрессии, но это остается очень сложной проблемой.

Относительно небольшая длина списков генов, опубликованных в результате экспериментов по профилированию экспрессии, ограничивает степень согласия экспериментов, проведенных в разных лабораториях. Размещение результатов профилирования экспрессии в общедоступной базе данных микрочипов позволяет исследователям оценивать закономерности экспрессии, выходящие за рамки опубликованных результатов, возможно, выявляя сходство со своей собственной работой.

Валидация измерений с высокой пропускной способностью

И ДНК-микрочипы , и количественная ПЦР используют преимущественное связывание или « спаривание оснований » комплементарных последовательностей нуклеиновых кислот, и оба используются для профилирования экспрессии генов, часто серийным образом. Хотя высокопроизводительным ДНК-микрочипам не хватает количественной точности кПЦР, для измерения экспрессии нескольких десятков генов с помощью кПЦР требуется примерно то же время, что и для измерения всего генома с использованием ДНК-микрочипов. Поэтому часто имеет смысл провести эксперименты по полуколичественному анализу микрочипов ДНК для идентификации генов-кандидатов, а затем выполнить кПЦР на некоторых из наиболее интересных генов-кандидатов для проверки результатов микрочипов. Другие эксперименты, такие как вестерн-блоттинг некоторых белковых продуктов дифференциально экспрессируемых генов, делают выводы, основанные на профиле экспрессии, более убедительными, поскольку уровни мРНК не обязательно коррелируют с количеством экспрессируемого белка.

Статистический анализ

Анализ данных микрочипов стал областью интенсивных исследований. ^[10] Простое утверждение о том, что группа генов регулируется как минимум двумя способами, что когда-то было обычной практикой, не имеет под собой прочной статистической основы. При пяти или меньшем количестве повторов в каждой группе, что типично для микрочипов, единственное наблюдение выброса может создать кажущуюся разницу более чем в два раза. Кроме того, произвольное установление двукратной планки биологически нецелесообразно, поскольку исключает из рассмотрения многие гены, имеющие очевидную биологическую значимость.

Вместо того, чтобы идентифицировать дифференциально экспрессирующиеся гены, используя пороговое значение кратности изменения, можно использовать различные статистические тесты или комплексные тесты, такие как ANOVA , каждый из которых учитывает как кратность изменения, так и изменчивость, чтобы создать p-значение , оценку того, как часто мы будем наблюдайте за данными случайно. Применение p-значений к микрочипам осложняется большим количеством задействованных множественных сравнений (генов). Например, обычно считается, что значение p 0,05 указывает на значимость, поскольку оно оценивает вероятность случайного наблюдения данных в 5%. Но при наличии 10 000 генов на микрочипе 500 генов были бы идентифицированы как значимые при p < 0,05, даже если бы между экспериментальными группами не было различий. Одно из очевидных решений состоит в том, чтобы считать значимыми только те гены, которые соответствуют гораздо более строгому критерию значения p, например, можно выполнить поправку Бонферрони к значениям p или использовать ложный расчет скорости открытия , чтобы скорректировать значения p пропорционально числу параллельных тестов. К сожалению, эти подходы могут свести количество значимых генов к нулю, даже если гены на самом деле экспрессируются дифференциально. Текущая статистика, такая как Продукты ранжирования направлены на достижение баланса между ложным открытием генов из-за случайных изменений и необнаружением дифференциально экспрессируемых генов. Часто упоминаемые методы включают анализ значимости микрочипов (SAM). ^[11] и широкий выбор методов доступен от Bioconductor , а также различные пакеты анализа от биоинформатических компаний .

Выбор другого теста обычно определяет другой список значимых генов. ^[12] поскольку каждый тест работает при определенном наборе предположений и уделяет разное внимание определенным особенностям данных. Многие тесты начинаются с предположения о нормальном распределении данных, поскольку это кажется разумной отправной точкой и часто дает результаты, которые кажутся более значимыми. Некоторые тесты рассматривают совместное распределение всех наблюдений за генами для оценки общей изменчивости измерений. ^[13] в то время как другие рассматривают каждый ген изолированно. Многие современные методы анализа микрочипов включают в себя бутстрэппинг (статистику) , машинное обучение или методы Монте-Карло . ^[14]

По мере увеличения количества повторных измерений в эксперименте с микроматрицами различные статистические подходы дают все более схожие результаты, но отсутствие согласованности между различными статистическими методами делает результаты массивов менее надежными. Проект MAQC ^[15] дает рекомендации, которые помогут исследователям выбрать более стандартные методы (например, совместное использование p-значения и кратного изменения для выбора дифференциально экспрессируемых генов), чтобы эксперименты, проводимые в разных лабораториях, лучше согласовывались.

В отличие от анализа дифференциально экспрессируемых отдельных генов, другой тип анализа фокусируется на дифференциальной экспрессии или возмущении заранее определенных наборов генов и называется анализом набора генов. ^[16]^[17] Анализ набора генов продемонстрировал несколько основных преимуществ по сравнению с анализом дифференциальной экспрессии отдельных генов. ^[16]^[17] Наборы генов — это группы генов, которые функционально связаны в соответствии с современными знаниями. Таким образом, анализ набора генов считается подходом к анализу, основанным на знаниях. ^[16] Обычно используемые наборы генов включают те, которые получены из путей KEGG , терминов онтологии генов , групп генов, которые имеют некоторые другие функциональные аннотации, такие как общие регуляторы транскрипции и т. д. Типичные методы анализа набора генов включают анализ обогащения набора генов (GSEA), ^[16] который оценивает значимость наборов генов на основе перестановки меток образцов и общеприменимого обогащения набора генов (GAGE), ^[17] который проверяет значимость наборов генов на основе перестановки меток генов или параметрического распределения.

Генная аннотация

Хотя статистика может определить, какие генные продукты изменяются в экспериментальных условиях, биологический смысл профилирования экспрессии зависит от знания того, какой белок образует каждый генный продукт и какую функцию выполняет этот белок. Аннотации генов предоставляют функциональную и другую информацию, например расположение каждого гена в определенной хромосоме. Некоторые функциональные аннотации более надежны, чем другие; некоторые отсутствуют. Базы данных аннотаций генов регулярно меняются, и разные базы данных относятся к одному и тому же белку под разными именами, что отражает меняющееся понимание функции белка. Использование стандартизированной номенклатуры генов помогает решить проблему именования, но точное соответствие транскриптов генам ^[18]^[19] остается важным фактором.

Классификация регулируемых генов

После идентификации некоторого набора регулируемых генов следующим шагом в профилировании экспрессии является поиск закономерностей внутри регулируемого набора. Выполняют ли белки, созданные из этих генов, схожие функции? Похожи ли они по химическому составу? Находятся ли они в одинаковых частях клетки? Анализ онтологии генов обеспечивает стандартный способ определения этих отношений. Онтологии генов начинаются с очень широких категорий, например, «метаболический процесс», и разбивают их на более мелкие категории, например, «процесс метаболизма углеводов», и, наконец, на весьма ограничительные категории, такие как «фосфорилирование инозитола и производных».

Помимо биологической функции, химических свойств и клеточного расположения у генов есть и другие атрибуты. Можно составлять наборы генов на основе близости к другим генам, связи с заболеванием и связи с лекарствами или токсинами. База данных молекулярных сигнатур ^[20] и база данных сравнительной токсикогеномики. ^[21] являются примерами ресурсов для классификации генов по множеству способов.

Поиск закономерностей среди регулируемых генов

Схема генной сети изобретательности ^[22] который динамически собирает гены с известными взаимосвязями. Зеленый цвет указывает на пониженную экспрессию, красный указывает на повышенную экспрессию. Алгоритм включил нерегулируемые гены white для улучшения связности.

Регулируемые гены классифицируются в зависимости от того, что они из себя представляют и что они делают; могут возникнуть важные взаимоотношения между генами. ^[23] Например, мы можем увидеть свидетельства того, что определенный ген создает белок, образующий фермент, который активирует белок, включающий второй ген в нашем списке. Этот второй ген может быть фактором транскрипции , регулирующим еще один ген из нашего списка. Наблюдая за этими связями, мы можем начать подозревать, что они представляют собой нечто большее, чем просто случайные ассоциации в результатах, и что все они попали в наш список из-за лежащего в их основе биологического процесса. С другой стороны, может случиться так, что если выбрать гены наугад, можно обнаружить множество общих черт. В этом смысле нам нужны строгие статистические процедуры, чтобы проверить, являются ли возникающие биологические темы значимыми или нет. Вот где анализ набора генов ^[16]^[17] входит.

Причинно-следственные связи

Довольно простая статистика позволяет оценить, являются ли ассоциации между генами в списках более значительными, чем можно было бы ожидать случайно. Эта статистика интересна, даже если она представляет собой существенное упрощение того, что происходит на самом деле. Вот пример. Предположим, в эксперименте участвуют 10 000 генов, только 50 (0,5%) из которых играют известную роль в выработке холестерина . В ходе эксперимента выявлено 200 регулируемых генов. Из них 40 (20%) также входят в список генов холестерина. Основываясь на общей распространенности генов холестерина (0,5%), можно ожидать, что в среднем на каждые 200 регулируемых генов приходится 1 ген холестерина, то есть 0,005 умноженный на 200. Это ожидание является средним, поэтому можно ожидать увидеть более одного гена холестерина в некоторых случаях. время. Вопрос в том, как часто мы увидим 40 вместо 1 по чистой случайности.

Согласно гипергеометрическому распределению , можно было бы попытаться выполнить около 10^57 раз (10 с последующими 56 нулями), прежде чем выбрать 39 или более генов холестерина из пула в 10 000, выбрав 200 генов случайным образом. Если обратить много внимания на то, насколько бесконечно мала вероятность случайного наблюдения этого явления, можно прийти к выводу, что регулируемый список генов обогащается. ^[24] в генах с известной ассоциацией с холестерином.

Можно также предположить, что экспериментальное лечение регулирует уровень холестерина, поскольку лечение, по-видимому, избирательно регулирует гены, связанные с холестерином. Хотя это может быть правдой, существует ряд причин, по которым делать такой твердый вывод, основанный только на обогащении, представляет собой неоправданный скачок веры. Одна ранее упомянутая проблема связана с наблюдением, что регуляция генов может не иметь прямого влияния на регуляцию белков: даже если белки, кодируемые этими генами, не делают ничего, кроме выработки холестерина, показ того, что их мРНК изменена, не говорит нам напрямую, что именно происходит на белковом уровне. Вполне возможно, что количество этих белков, связанных с холестерином, остается постоянным в условиях эксперимента. Во-вторых, даже если уровни белков действительно меняются, возможно, их всегда достаточно, чтобы вырабатывать холестерин настолько быстро, насколько это возможно, то есть другой белок, которого нет в нашем списке, является определяющим шагом в процессе образования. холестерин. Наконец, белки обычно играют множество ролей, поэтому эти гены могут регулироваться не из-за их общей связи с выработкой холестерина, а из-за общей роли в совершенно независимом процессе.

Принимая во внимание вышеизложенные предостережения, хотя профили генов сами по себе не доказывают причинно-следственных связей между лечением и биологическими эффектами, они все же предлагают уникальные биологические идеи, к которым часто было бы очень трудно прийти другими способами.

Использование шаблонов для поиска регулируемых генов

Как описано выше, можно сначала идентифицировать значительно регулируемые гены, а затем найти закономерности, сравнивая список значимых генов с наборами генов, которые, как известно, имеют определенные ассоциации. Можно также решить задачу в обратном порядке. Вот очень простой пример. Предположим, есть 40 генов, связанных с известным процессом, например, предрасположенностью к диабету. Глядя на две группы профилей экспрессии: одну для мышей, получавших диету с высоким содержанием углеводов, и одну для мышей, получавших диету с низким содержанием углеводов, можно заметить, что все 40 генов диабета экспрессируются на более высоком уровне в группе с высоким содержанием углеводов, чем в группе с низким содержанием углеводов. Независимо от того, попал ли бы какой-либо из этих генов в список значительно измененных генов, наблюдение за всеми 40 вверх и ни одним вниз вряд ли является результатом чистой случайности: прогнозируется, что выпадение 40 орлов подряд произойдет примерно один раз. за триллион попыток с использованием честной монеты.

Для типа клетки группа генов, комбинированный характер экспрессии которых уникально характерен для данного состояния, представляет собой генную сигнатуру этого состояния. В идеале сигнатуру гена можно использовать для отбора группы пациентов на определенном этапе заболевания с точностью, облегчающей выбор лечения. ^[25]^[26] Анализ обогащения набора генов (GSEA) ^[16] и подобные методы ^[17] Воспользуйтесь преимуществами такого рода логики, но используйте более сложную статистику, поскольку гены-компоненты в реальных процессах демонстрируют более сложное поведение, чем просто движение вверх или вниз как группа, и значение имеет величина перемещения генов вверх и вниз, а не только направление. В любом случае, эта статистика показывает, насколько отличается поведение некоторого небольшого набора генов от поведения генов, не входящих в этот небольшой набор.

GSEA использует статистику в стиле Колмогорова-Смирнова, чтобы увидеть, проявляют ли какие-либо ранее определенные наборы генов необычное поведение в текущем профиле экспрессии. Это приводит к возникновению проблемы проверки множественных гипотез, но существуют разумные методы ее решения. ^[27]

Выводы

Профилирование экспрессии дает новую информацию о том, что делают гены в различных условиях. В целом, технология микрочипов позволяет получить надежные профили экспрессии. ^[28] На основе этой информации можно генерировать новые гипотезы о биологии или проверять существующие. Однако размер и сложность этих экспериментов часто приводят к широкому разнообразию возможных интерпретаций. Во многих случаях анализ результатов профилирования выражений требует гораздо больше усилий, чем проведение первоначальных экспериментов.

Большинство исследователей используют несколько статистических методов и исследовательский анализ данных, прежде чем публиковать результаты профилирования экспрессии, координируя свои усилия с биоинформатиком или другим экспертом в области микрочипов ДНК . Хороший экспериментальный дизайн, адекватная биологическая репликация и последующие эксперименты играют ключевую роль в успешных экспериментах по профилированию экспрессии.

См. также

Ссылки

^ «Информационный бюллетень по микроматрицам» . Проверено 28 декабря 2007 г.
^ Сутер Л., Бэбисс Л.Е., Уилдон Э.Б. (2004). «Токсикогеномика в прогнозной токсикологии при разработке лекарств» . хим. Биол . 11 (2): 161–71. doi : 10.1016/j.chembiol.2004.02.003 . ПМИД 15123278 .
^ Мэджик З, Радулович С, Бранкович-Мэджик М (2007). «Микрочипы кДНК: идентификация сигнатур генов и их применение в клинической практике». Джей БУОН . 12 (Приложение 1): S39–44. ПМИД 17935276 .
^ Чунг А.Н. (2007). «Молекулярные мишени при гинекологическом раке». Патология . 39 (1): 26–45. дои : 10.1080/00313020601153273 . ПМИД 17365821 . S2CID 40896577 .
^ Мирза С.П., Оливье М. (2007). «Методы и подходы комплексной характеристики и количественного определения клеточных протеомов с использованием масс-спектрометрии» . Физиологическая Геномика . 33 (1): 3–11. doi : 10.1152/физиологгеномика.00292.2007 . ПМК 2771641 . ПМИД 18162499 .
^ Хеберт А.С., Ричардс А.Л. и др. (2014). «Протеом одночасовых дрожжей» . Мол клеточная протеомика . 13 (1): 339–347. дои : 10.1074/mcp.M113.034769 . ПМЦ 3879625 . ПМИД 24143002 .
^ Чен Джей-Джей (2007). «Ключевые аспекты анализа данных об экспрессии генов на микрочипах» . Фармакогеномика . 8 (5): 473–82. дои : 10.2217/14622416.8.5.473 . ПМИД 17465711 .
^ ван Донген, Стейн (2000). Кластеризация графов с помощью Flow Simulation . Университет Утрехта.
^ Ясковяк, Пабло А; Кампелло, Рикардо Дж.Г.Б.; Коста, Иван Г (24 января 2014 г.). «О выборе подходящих расстояний для кластеризации данных об экспрессии генов» . БМК Биоинформатика . 15 (Приложение 2): S2. дои : 10.1186/1471-2105-15-S2-S2 . ПМК 4072854 . ПМИД 24564555 .
^ Вардханабхути С., Блейкмор С.Дж., Кларк С.М., Гош С., Стивенс Р.Дж., Раджагопалан Д. (2006). «Сравнение статистических тестов для обнаружения дифференциальной экспрессии с использованием олигонуклеотидных микрочипов Affymetrix». ОМИКС . 10 (4): 555–66. дои : 10.1089/omi.2006.10.555 . ПМИД 17233564 .
^ «Анализ значимости микрочипов» . Архивировано из оригинала 20 января 2008 г. Проверено 27 декабря 2007 г.
^ Яук КЛ, Берндт МЛ (2007). «Обзор литературы, исследующей взаимосвязь между технологиями микрочипов ДНК» . Окружающая среда. Мол. Мутаген . 48 (5): 380–94. Бибкод : 2007EnvMM..48..380Y . дои : 10.1002/em.20290 . ПМЦ 2682332 . ПМИД 17370338 .
^ Брейтлинг Р (2006 г.). «Интерпретация биологического микрочипа: правила использования» (PDF) . Биохим. Биофиз. Акта . 1759 (7): 319–27. дои : 10.1016/j.bbaexp.2006.06.003 . ПМИД 16904203 . S2CID 1857997 .
^ Драмински М., Рада-Иглесиас А., Энрот С., Ваделиус С., Коронацкий Дж., Коморовски Дж. (2008). «Выбор признаков Монте-Карло для контролируемой классификации» . Биоинформатика . 24 (1): 110–7. doi : 10.1093/биоинформатика/btm486 . ПМИД 18048398 .
^ Доктор Леминг Ши, Национальный центр токсикологических исследований. «Проект контроля качества MicroArray (MAQC)» . Управление по контролю за продуктами и лекарствами США . Проверено 26 декабря 2007 г.
^ Перейти обратно: ^а ^б ^с ^д ^и ^ж Субраманиан А., Тамайо П., Мута В.К., Мукерджи С., Эберт Б.Л., Джилет М.А., Павлович А., Помрой С.Л., Голуб Т.Р., Ландер Э.С., Месиров Дж.П. (2005). «Анализ обогащения генного набора: основанный на знаниях подход к интерпретации профилей экспрессии в масштабе всего генома» . Учеб. Натл. акад. наук. США . 102 (43): 15545–50. дои : 10.1073/pnas.0506580102 . ПМЦ 1239896 . ПМИД 16199517 .
^ Перейти обратно: ^а ^б ^с ^д ^и Луо В., Фридман М., Шедден К., Ханкенсон К.Д., Вульф Дж.П. (2009). «GAGE: общеприменимое обогащение набора генов для анализа путей» . БМК Биоинформатика . 10 :161. дои : 10.1186/1471-2105-10-161 . ПМК 2696452 . ПМИД 19473525 .
^ Дай М., Ван П., Бойд А.Д. и др. (2005). «Развивающиеся определения генов/транскриптов существенно меняют интерпретацию данных GeneChip» . Нуклеиновые кислоты Рез . 33 (20): е175. дои : 10.1093/nar/gni179 . ПМЦ 1283542 . ПМИД 16284200 .
^ Альбертс Р., Терпстра П., Хардонк М. и др. (2007). «Протокол проверки последовательностей зондов геномных массивов Affymetrix демонстрирует высокую точность зондов при исследованиях на мышах, людях и крысах» . БМК Биоинформатика . 8 : 132. дои : 10.1186/1471-2105-8-132 . ПМЦ 1865557 . ПМИД 17448222 .
^ «ВГЭА – MSigDB» . Проверено 3 января 2008 г.
^ «CTD: База данных сравнительной токсикогеномики» . Проверено 3 января 2008 г.
^ «Системы изобретательности» . Проверено 27 декабря 2007 г.
^ Алексеев О.М., Ричардсон Р.Т., Алексеев О., О'Рэнд М.Г. (2009). «Анализ профилей экспрессии генов в клетках HeLa в ответ на сверхэкспрессию или опосредованное siRNA истощение NASP» . Репродукция. Биол. Эндокринол . 7:45 . дои : 10.1186/1477-7827-7-45 . ПМЦ 2686705 . ПМИД 19439102 .
^ Кертис Р.К., Оресич М., Видаль-Пуч А. (2005). «Пути к анализу данных микрочипов». Тенденции Биотехнологии . 23 (8): 429–35. дои : 10.1016/j.tibtech.2005.05.011 . ПМИД 15950303 .
^ Мук С., Вант Вир Л.Дж., Рутгерс Э.Дж., Пиккарт-Гебхарт М.Дж., Кардозо Ф. (2007). «Индивидуализация терапии с использованием Mammaprint: от разработки до исследования MINDACT». Геномика рака, протеомика . 4 (3): 147–55. ПМИД 17878518 .
^ Корселло С.М., Роти Дж., Росс К.Н., Чоу К.Т., Галинский И., ДеАнджело Д.Д., Стоун Р.М., Кунг А.Л., Голуб Т.Р., Стегмайер К. (июнь 2009 г.). «Идентификация модуляторов AML1-ETO методом химической геномики» . Кровь . 113 (24): 6193–205. дои : 10.1182/blood-2008-07-166090 . ПМЦ 2699238 . ПМИД 19377049 .
^ «ГСЭА» . Проверено 9 января 2008 г.
^ Кузен Дж (2006). «Геномика. Данные микрочипов воспроизведены, но некоторые опасения остаются». Наука . 313 (5793): 1559. doi : 10.1126/science.313.5793.1559a . ПМИД 16973852 . S2CID 58528299 .

Внешние ссылки

Сравнительный транскриптомный анализ в справочном модуле по наукам о жизни

[1] «Информационный бюллетень по микроматрицам» . Проверено 28 декабря 2007 г.

[pmid15123278-2] Сутер Л., Бэбисс Л.Е., Уилдон Э.Б. (2004). «Токсикогеномика в прогнозной токсикологии при разработке лекарств» . хим. Биол . 11 (2): 161–71. doi : 10.1016/j.chembiol.2004.02.003 . ПМИД 15123278 .

[3] Мэджик З, Радулович С, Бранкович-Мэджик М (2007). «Микрочипы кДНК: идентификация сигнатур генов и их применение в клинической практике». Джей БУОН . 12 (Приложение 1): S39–44. ПМИД 17935276 .

[pmid17365821-4] Чунг А.Н. (2007). «Молекулярные мишени при гинекологическом раке». Патология . 39 (1): 26–45. дои : 10.1080/00313020601153273 . ПМИД 17365821 . S2CID 40896577 .

[5] Мирза С.П., Оливье М. (2007). «Методы и подходы комплексной характеристики и количественного определения клеточных протеомов с использованием масс-спектрометрии» . Физиологическая Геномика . 33 (1): 3–11. doi : 10.1152/физиологгеномика.00292.2007 . ПМК 2771641 . ПМИД 18162499 .

[6] Хеберт А.С., Ричардс А.Л. и др. (2014). «Протеом одночасовых дрожжей» . Мол клеточная протеомика . 13 (1): 339–347. дои : 10.1074/mcp.M113.034769 . ПМЦ 3879625 . ПМИД 24143002 .

[7] Чен Джей-Джей (2007). «Ключевые аспекты анализа данных об экспрессии генов на микрочипах» . Фармакогеномика . 8 (5): 473–82. дои : 10.2217/14622416.8.5.473 . ПМИД 17465711 .

[8] ван Донген, Стейн (2000). Кластеризация графов с помощью Flow Simulation . Университет Утрехта.

[9] Ясковяк, Пабло А; Кампелло, Рикардо Дж.Г.Б.; Коста, Иван Г (24 января 2014 г.). «О выборе подходящих расстояний для кластеризации данных об экспрессии генов» . БМК Биоинформатика . 15 (Приложение 2): S2. дои : 10.1186/1471-2105-15-S2-S2 . ПМК 4072854 . ПМИД 24564555 .

[pmid17233564-10] Вардханабхути С., Блейкмор С.Дж., Кларк С.М., Гош С., Стивенс Р.Дж., Раджагопалан Д. (2006). «Сравнение статистических тестов для обнаружения дифференциальной экспрессии с использованием олигонуклеотидных микрочипов Affymetrix». ОМИКС . 10 (4): 555–66. дои : 10.1089/omi.2006.10.555 . ПМИД 17233564 .

[11] «Анализ значимости микрочипов» . Архивировано из оригинала 20 января 2008 г. Проверено 27 декабря 2007 г.

[pmid17370338-12] Яук КЛ, Берндт МЛ (2007). «Обзор литературы, исследующей взаимосвязь между технологиями микрочипов ДНК» . Окружающая среда. Мол. Мутаген . 48 (5): 380–94. Бибкод : 2007EnvMM..48..380Y . дои : 10.1002/em.20290 . ПМЦ 2682332 . ПМИД 17370338 .

[13] Брейтлинг Р (2006 г.). «Интерпретация биологического микрочипа: правила использования» (PDF) . Биохим. Биофиз. Акта . 1759 (7): 319–27. дои : 10.1016/j.bbaexp.2006.06.003 . ПМИД 16904203 . S2CID 1857997 .

[14] Драмински М., Рада-Иглесиас А., Энрот С., Ваделиус С., Коронацкий Дж., Коморовски Дж. (2008). «Выбор признаков Монте-Карло для контролируемой классификации» . Биоинформатика . 24 (1): 110–7. doi : 10.1093/биоинформатика/btm486 . ПМИД 18048398 .

[15] Доктор Леминг Ши, Национальный центр токсикологических исследований. «Проект контроля качества MicroArray (MAQC)» . Управление по контролю за продуктами и лекарствами США . Проверено 26 декабря 2007 г.

[pmid16199517-16] Перейти обратно: ^а ^б ^с ^д ^и ^ж Субраманиан А., Тамайо П., Мута В.К., Мукерджи С., Эберт Б.Л., Джилет М.А., Павлович А., Помрой С.Л., Голуб Т.Р., Ландер Э.С., Месиров Дж.П. (2005). «Анализ обогащения генного набора: основанный на знаниях подход к интерпретации профилей экспрессии в масштабе всего генома» . Учеб. Натл. акад. наук. США . 102 (43): 15545–50. дои : 10.1073/pnas.0506580102 . ПМЦ 1239896 . ПМИД 16199517 .

[pmid19473525-17] Перейти обратно: ^а ^б ^с ^д ^и Луо В., Фридман М., Шедден К., Ханкенсон К.Д., Вульф Дж.П. (2009). «GAGE: общеприменимое обогащение набора генов для анализа путей» . БМК Биоинформатика . 10 :161. дои : 10.1186/1471-2105-10-161 . ПМК 2696452 . ПМИД 19473525 .

[18] Дай М., Ван П., Бойд А.Д. и др. (2005). «Развивающиеся определения генов/транскриптов существенно меняют интерпретацию данных GeneChip» . Нуклеиновые кислоты Рез . 33 (20): е175. дои : 10.1093/nar/gni179 . ПМЦ 1283542 . ПМИД 16284200 .

[19] Альбертс Р., Терпстра П., Хардонк М. и др. (2007). «Протокол проверки последовательностей зондов геномных массивов Affymetrix демонстрирует высокую точность зондов при исследованиях на мышах, людях и крысах» . БМК Биоинформатика . 8 : 132. дои : 10.1186/1471-2105-8-132 . ПМЦ 1865557 . ПМИД 17448222 .

[20] «ВГЭА – MSigDB» . Проверено 3 января 2008 г.

[21] «CTD: База данных сравнительной токсикогеномики» . Проверено 3 января 2008 г.

[22] «Системы изобретательности» . Проверено 27 декабря 2007 г.

[pmid19439102-23] Алексеев О.М., Ричардсон Р.Т., Алексеев О., О'Рэнд М.Г. (2009). «Анализ профилей экспрессии генов в клетках HeLa в ответ на сверхэкспрессию или опосредованное siRNA истощение NASP» . Репродукция. Биол. Эндокринол . 7:45 . дои : 10.1186/1477-7827-7-45 . ПМЦ 2686705 . ПМИД 19439102 .

[pmid15950303-24] Кертис Р.К., Оресич М., Видаль-Пуч А. (2005). «Пути к анализу данных микрочипов». Тенденции Биотехнологии . 23 (8): 429–35. дои : 10.1016/j.tibtech.2005.05.011 . ПМИД 15950303 .

[pmid17878518-25] Мук С., Вант Вир Л.Дж., Рутгерс Э.Дж., Пиккарт-Гебхарт М.Дж., Кардозо Ф. (2007). «Индивидуализация терапии с использованием Mammaprint: от разработки до исследования MINDACT». Геномика рака, протеомика . 4 (3): 147–55. ПМИД 17878518 .

[pmid19377049-26] Корселло С.М., Роти Дж., Росс К.Н., Чоу К.Т., Галинский И., ДеАнджело Д.Д., Стоун Р.М., Кунг А.Л., Голуб Т.Р., Стегмайер К. (июнь 2009 г.). «Идентификация модуляторов AML1-ETO методом химической геномики» . Кровь . 113 (24): 6193–205. дои : 10.1182/blood-2008-07-166090 . ПМЦ 2699238 . ПМИД 19377049 .

[27] «ГСЭА» . Проверено 9 января 2008 г.

[28] Кузен Дж (2006). «Геномика. Данные микрочипов воспроизведены, но некоторые опасения остаются». Наука . 313 (5793): 1559. doi : 10.1126/science.313.5793.1559a . ПМИД 16973852 . S2CID 58528299 .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]

[23]

[24]

[25]

[26]

[27]

[28]