область РА
График среднего отношения (RA) — это целочисленная версия графика MA для визуализации данных подсчета с двумя условиями. Его отличительная стреловидная форма обусловлена тем, что он включает уникальные для условий точки (0, n ) или ( n в график ,0) с помощью эпсилон-фактора .
Определение
[ редактировать ]График RA , как и его двоюродный брат, график MA , представляет собой измененную масштабированную и повернутую на 45 градусов версию простой двумерной диаграммы рассеяния зависимости a от b, где a и b — векторы положительных измерений одинаковой длины. Такое изменение масштаба и поворот позволяют лучше видеть и выделять важные точки выбросов, которые различаются в зависимости от двух условий измерения. [1] По сути, это график зависимости логарифма [R] от среднего логарифма [A] каждой пары элементов a и b . Однако, в отличие от графика MA, поскольку график RA принимает в качестве входных данных неотрицательные целые числа, он должен использовать обходные пути для включения математически невидимых точек (например, точек, в которых один или оба элемента пары равны нулю).
Если мы изменим наш исходный вектор a (или b ) с помощью:
где
тогда R и A можно определить как:
R , как и M , откладывается на оси y и представляет собой логарифмическое (кратное изменение) соотношение между a и b . A отложена на оси x и представляет собой среднее содержание для пары координат. График RA дает быстрый обзор распределения и размера набора данных, состоящего из ненулевых значений.
Этимология
[ редактировать ]Префикс аббревиатуры «РА» иногда произносится как односложное слово «луч» из-за сильного сходства сюжета с геометрическим лучом . Эта характерная стреловидная форма обусловлена двумя ключевыми особенностями: справа в начале вектора - длинный асимптотический хвост, а слева (образующие наконечник стрелки) - два (часто плотных) участка точек, уникальных по условиям.
Обходные пути для обеспечения видимости и включения точек
[ редактировать ]Условные уникальные баллы
[ редактировать ]Поскольку большая часть пар a и b содержит нули в одном или обоих условиях, их невозможно отобразить как есть в логарифмическом масштабе. Другие функции построения графика MA искусственно включают эти уникальные для условий точки на график, распределяя их по вертикали в виде «мазка» слева или по горизонтали в виде « ковра » в самом верху и внизу графика. На графике RA, напротив, уникальные объекты включаются путем добавления небольшого эпсилон-коэффициента (между 0,1 и 0,5), который помещает их в более статистически подходящее место на графике.
Перерисовка
[ редактировать ]Другая проблема с построением этого (или любого) типа данных подсчета — это наложение графиков , которое решается на графике RA путем смещения точек друг от друга, но не настолько, чтобы слиться с другими координатами. Результатом использования этой функции является лоскутный вид графика, который исчезает по мере A. увеличения
Пакеты
[ редактировать ]Пакет Caroline CRAN R содержит единственную известную реализацию графика RA. Однако пакет мета-транскриптомики «manta» R представляет собой оболочку для этой реализации графика RA и используется для оценки кратности изменения транскрипции генов (точек) при одновременной визуализации таксономического распределения каждого гена в виде отдельных точек круговой диаграммы. [2]
Примеры
[ редактировать ]library(caroline) a <- rnbinom(n=10000, mu=5, size=2) b <- rnbinom(n=10000, mu=5, size=2) raPlot(a, b)
Ссылки
[ редактировать ]- ^ Дюдуа, С. , Ян, Ю.Х. , Кэллоу, М.Дж., Спид, Т.П. (2002). Статистические методы идентификации дифференциально экспрессируемых генов в экспериментах с реплицируемыми микрочипами кДНК. Стат. Грех. 12:1 111–139
- ^ Шрут, Д. и Маркетти, А. (2011). Нормализованный транскриптный анализ микробной сборки. Пакет R версии 0.9.5.