Рейтинг продукта
Ранговое произведение представляет собой биологически мотивированный ранговый тест для обнаружения дифференциально экспрессируемых генов в повторяющихся экспериментах на микрочипах .Это простой непараметрический статистический метод, основанный на рангах кратных изменений. Помимо использования в профилировании экспрессии , его можно использовать для объединения ранжированных списков в различных областях применения, включая протеомику , метаболомику , статистический метаанализ и общий отбор признаков .
Расчет рангового произведения
[ редактировать ]Учитывая n генов и k повторов, пусть ранг гена g в i -м повторе.
Вычислите произведение ранга через среднее геометрическое :
Определение уровней значимости
[ редактировать ]Простая оценка на основе перестановок используется для определения того, насколько вероятно, что данное значение RP или лучше будет наблюдаться в случайном эксперименте.
- сгенерировать p перестановок списков k ранга длины n .
- вычислить ранговые произведения n генов в p перестановках.
- подсчитайте, во сколько раз ранговые произведения генов в перестановках меньше или равны наблюдаемому ранговому произведению. Установите c это значение.
- вычислите среднее ожидаемое значение для рангового продукта по формуле: .
- Рассчитайте процент ложных срабатываний как: где — это ранг гена g в списке всех n генов, отсортированных по возрастанию .
Точное распределение вероятностей и точная аппроксимация
[ редактировать ]Повторная выборка перестановок требует большого количества вычислений, чтобы получить надежные оценки значений p для наиболее дифференциально экспрессируемых генов, если n велико. Эйсинга, Брейтлинг и Хескес (2013) приводят точное вероятностное массовое распределение статистики рангового произведения. Вычисление точных значений p дает существенное улучшение по сравнению с аппроксимацией перестановок, особенно для той части анализа произведения ранга распределения, которая больше всего интересует, то есть для тонкого правого хвоста. Однако вычисление точной статистической значимости продуктов большого ранга может занять неприемлемо много времени. Хескес, Эйсинга и Брейтлинг (2014) предлагают метод определения точных приблизительных значений p статистики рангового произведения с использованием быстрых вычислений.
См. также
[ редактировать ]Ссылки
[ редактировать ]- Брейтлинг Р., Арменгауд П., Амтманн А. и Херзик П. (2004) Ранжирование продуктов: простой, но мощный новый метод обнаружения дифференциально регулируемых генов в повторяющихся экспериментах на микрочипах, FEBS Letters, 573:83 ---92
- Эйсинга, Р.; Брейтлинг, Р.; Хескес, Т. (2013). «Точное распределение вероятностей статистики рангового произведения для повторяющихся экспериментов». Письма ФЭБС . 587 (6): 677–682. дои : 10.1016/j.febslet.2013.01.037 . hdl : 2066/116720 . ПМИД 23395607 . S2CID 246960 .
- Хескес, Т.; Эйсинга, Р.; Брейтлинг, Р. (2014). «Быстрый алгоритм определения границ и точных приблизительных p -значений статистики рангового произведения для повторяющихся экспериментов» . БМК Биоинформатика . 15 (1): 367. doi : 10.1186/preaccept-1857144210135244 . ПМЦ 4245829 . ПМИД 25413493 .