Индекс чувствительности

Индекс чувствительности или индекс различимости или индекс обнаруживаемости — это безразмерная статистика, используемая в теории обнаружения сигналов . Более высокий индекс указывает на то, что сигнал легче обнаружить.

Определение

Индекс различимости — это разделение средних значений двух распределений (обычно распределения сигнала и шума) в единицах стандартного отклонения.

Равные дисперсии/ковариации

Для двух одномерных распределений $a$ и $b$ с тем же стандартным отклонением, оно обозначается $d'$ («ди-прайм»):

d'={\frac {\left\vert \mu _{a}-\mu _{b}\right\vert }{\sigma }}

.

В более высоких измерениях, т. е. с двумя многомерными распределениями с одинаковой дисперсионно-ковариационной матрицей. $\mathbf {\Sigma }$ , (чей симметричный квадратный корень, матрица стандартного отклонения, равен $\mathbf {S}$ ), это обобщается на расстояние Махаланобиса между двумя распределениями:

d'={\sqrt {({\boldsymbol {\mu }}_{a}-{\boldsymbol {\mu }}_{b})'\mathbf {\Sigma } ^{-1}({\boldsymbol {\mu }}_{a}-{\boldsymbol {\mu }}_{b})}}=\lVert \mathbf {S} ^{-1}({\boldsymbol {\mu }}_{a}-{\boldsymbol {\mu }}_{b})\rVert =\lVert {\boldsymbol {\mu }}_{a}-{\boldsymbol {\mu }}_{b}\rVert /\sigma _{\boldsymbol {\mu }}

,

где $\sigma _{\boldsymbol {\mu }}=1/\lVert \mathbf {S} ^{-1}{\boldsymbol {\mu }}\rVert$ - это 1-й срез sd вдоль единичного вектора ${\boldsymbol {\mu }}$ посредством средств, т.е. $d'$ равно $d'$ вдоль 1d среза через средства. ^[1]

Для двух двумерных распределений с одинаковой ковариацией дисперсии это определяется как:

{d'}^{2}={\frac {1}{1-\rho ^{2}}}\left({d'}_{x}^{2}+{d'}_{y}^{2}-2\rho {d'}_{x}{d'}_{y}\right)

,

где $\rho$ – коэффициент корреляции, и здесь $d'_{x}={\frac {{\mu _{b}}_{x}-{\mu _{a}}_{x}}{\sigma _{x}}}$ и $d'_{y}={\frac {{\mu _{b}}_{y}-{\mu _{a}}_{y}}{\sigma _{y}}}$ , т.е. включая знаки средних разностей вместо абсолютных. ^[1]

$d'$ также оценивается как $Z({\text{hit rate}})-Z({\text{false alarm rate}})$ . ^[2]^: 8

Неравные дисперсии/ковариации

Когда два распределения имеют разные стандартные отклонения (или, в общих измерениях, разные ковариационные матрицы), существует несколько конкурирующих индексов, каждый из которых сводится к $d'$ для равной дисперсии/ковариации.

Байесовский индекс различимости

Это максимальный (байесовский) индекс различимости двух распределений, основанный на величине их перекрытия, т.е. оптимальная (байесовская) ошибка классификации. $e_{b}$ идеальным наблюдателем или его дополнением оптимальная точность $a_{b}$ :

d'_{b}=-2Z\left({\text{Bayes error rate }}e_{b}\right)=2Z\left({\text{best accuracy rate }}a_{b}\right)

, ^[1]

где $Z$ — обратная кумулятивная функция распределения стандартного нормального. Байесовская различимость одномерных или многомерных нормальных распределений может быть вычислена численно. ^[1] ( код Matlab ), а также может использоваться в качестве приближения, когда распределения близки к нормальным.

$d'_{b}$ - это положительно определенная статистическая мера расстояния, свободная от предположений о распределениях, например, расхождение Кульбака-Лейблера. $D_{\text{KL}}$ . $D_{\text{KL}}(a,b)$ асимметричен, тогда как $d'_{b}(a,b)$ симметричен для двух распределений. Однако, $d'_{b}$ не удовлетворяет неравенству треугольника, поэтому не является полной метрикой. ^[1]

В частности, для задачи «да/нет» между двумя одномерными нормальными распределениями со средними значениями $\mu _{a},\mu _{b}$ и отклонения $v_{a}>v_{b}$ оптимальная по Байесу точность классификации равна: ^[1]

p(A|a)=p({\chi '}_{1,v_{a}\lambda }^{2}>v_{b}c),\;\;p(B|b)=p({\chi '}_{1,v_{b}\lambda }^{2}<v_{a}c)

,

где $\chi '^{2}$ обозначает нецентральное распределение хи-квадрат , $\lambda =\left({\frac {\mu _{a}-\mu _{b}}{v_{a}-v_{b}}}\right)^{2}$ , и $c=\lambda +{\frac {\ln v_{a}-\ln v_{b}}{v_{a}-v_{b}}}$ . Байесовская различимость $d'_{b}=2Z\left({\frac {p\left(A|a\right)+p\left(B|b\right)}{2}}\right).$

$d'_{b}$ также может быть вычислено по ROC-кривой задачи «да/нет» между двумя одномерными нормальными распределениями с одним критерием сдвига. Его также можно вычислить по кривой ROC любых двух распределений (с любым количеством переменных) со сдвигом отношения правдоподобия, определив точку на кривой ROC, которая находится дальше всего от диагонали. ^[1]

Для двухинтервальной задачи между этими распределениями оптимальная точность равна $a_{b}=p\left({\tilde {\chi }}_{{\boldsymbol {w}},{\boldsymbol {k}},{\boldsymbol {\lambda }},0,0}^{2}>0\right)$ ( ${\tilde {\chi }}^{2}$ обозначает обобщенное распределение хи-квадрат ), где ${\boldsymbol {w}}={\begin{bmatrix}\sigma _{s}^{2}&-\sigma _{n}^{2}\end{bmatrix}},\;{\boldsymbol {k}}={\begin{bmatrix}1&1\end{bmatrix}},\;{\boldsymbol {\lambda }}={\frac {\mu _{s}-\mu _{n}}{\sigma _{s}^{2}-\sigma _{n}^{2}}}{\begin{bmatrix}\sigma _{s}^{2}&\sigma _{n}^{2}\end{bmatrix}}$ . ^[1] Байесовская различимость $d'_{b}=2Z\left(a_{b}\right)$ .

Индекс различимости RMS sd

Общий приблизительный (т. е. неоптимальный) индекс различимости, имеющий замкнутую форму, состоит в том, чтобы брать среднее значение дисперсий, то есть среднеквадратичное значение двух стандартных отклонений: $d'_{a}=\left\vert \mu _{a}-\mu _{b}\right\vert /\sigma _{\text{rms}}$ ^[3] (также обозначается $d_{a}$ ). Это ${\sqrt {2}}$ раз $z$ -оценка площади под кривой рабочей характеристики приемника (AUC) однокритериального наблюдателя. Этот индекс расширяется до общих размеров как расстояние Махаланобиса с использованием объединенной ковариации, т.е. $\mathbf {S} _{\text{rms}}=\left[\left(\mathbf {\Sigma } _{a}+\mathbf {\Sigma } _{b}\right)/2\right]^{\frac {1}{2}}$ как обычная SD-матрица. ^[1]

Средний стандартный индекс различимости

Еще один индекс $d'_{e}=\left\vert \mu _{a}-\mu _{b}\right\vert /\sigma _{\text{avg}}$ , расширенный до общих размеров с помощью $\mathbf {S} _{\text{avg}}=\left(\mathbf {S} _{a}+\mathbf {S} _{b}\right)/2$ как обычная SD-матрица. ^[1]

Сравнение индексов

Было показано, что для двух одномерных нормальных распределений $d'_{a}\leq d'_{e}\leq d'_{b}$ , а для многомерных нормальных распределений $d'_{a}\leq d'_{e}$ все еще. ^[1]

Таким образом, $d'_{a}$ и $d'_{e}$ занижать максимальную различимость $d'_{b}$ одномерных нормальных распределений. $d'_{a}$ могу недооценить $d'_{b}$ максимум примерно на 30%. На пределе высокой различимости одномерных нормальных распределений $d'_{e}$ сходится к $d'_{b}$ . Эти результаты часто справедливы и для более высоких измерений, но не всегда. ^[1] Симпсон и Фиттер ^[3] продвинутый $d'_{a}$ как лучший показатель, особенно для двухинтервальных задач, но Дас и Гейслер ^[1] показали, что $d'_{b}$ – оптимальная различимость во всех случаях, и $d'_{e}$ часто является лучшим приближением в замкнутой форме, чем $d'_{a}$ , даже для двухинтервальных задач.

Примерный индекс $d'_{gm}$ , в котором используется среднее геометрическое стандартное отклонение, меньше, чем $d'_{b}$ при малой различимости, но больше при большой различимости. ^[1]

Вклад в различимость по каждому измерению

В общем, вклад в общую различимость каждого измерения или признака можно измерить, используя величину, на которую снижается различимость при удалении этого измерения. Если полная байесовская различимость равна $d'$ и байесовская различимость с размерностью $i$ удалено $d'_{-i}$ , мы можем определить вклад размерности $i$ как ${\sqrt {d'^{2}-{d'_{-i}}^{2}}}$ . Это то же самое, что и индивидуальная различимость размерности. $i$ когда ковариационные матрицы равны и диагональны, но в остальных случаях эта мера более точно отражает вклад измерения, чем его индивидуальная различимость. ^[1]

Масштабирование различимости двух распределений

Иногда нам может потребоваться масштабировать различимость двух распределений данных, перемещая их ближе или дальше друг от друга. Одним из таких случаев является ситуация, когда мы моделируем задачу обнаружения или классификации, и производительность модели превышает производительность объекта или наблюдаемых данных. В этом случае мы можем сблизить распределения переменных модели, чтобы они соответствовали наблюдаемым характеристикам, а также предсказать, какие конкретные точки данных должны начать перекрываться и быть неправильно классифицированы.

Есть несколько способов сделать это. Один из них — вычислить средний вектор и матрицу ковариации двух распределений, а затем выполнить линейное преобразование для интерполяции среднего значения и матрицы стандартного отклонения (квадратного корня из ковариационной матрицы) одного из распределений по отношению к другому. ^[1]

Другой способ — вычислить переменные решения точек данных (логарифмическое отношение правдоподобия того, что точка принадлежит одному распределению по сравнению с другим) в рамках мультинормальной модели, а затем переместить эти переменные решения ближе друг к другу или дальше друг от друга. ^[1]

См. также

Ссылки

^ Jump up to: ^а ^б ^с ^д ^и ^ж ^г ^час ^я ^дж ^к ^л ^м ^н ^тот ^п ^д ^р ^с Дас, Абранил; Уилсон С. Гейслер (2020). «Методы интеграции мультинормальных чисел и вычисления мер классификации». arXiv : 2012.14331 [ stat.ML ].
^ Макмиллан, Н.; Крилман, К. (2005). Теория обнаружения: Руководство пользователя . Лоуренс Эрлбаум Ассошиэйтс. ISBN 9781410611147 .
^ Jump up to: ^а ^б Симпсон, Эй Джей; Фиттер, MJ (1973). «Каков наилучший показатель обнаруживаемости?». Психологический вестник . 80 (6): 481–488. дои : 10.1037/h0035203 .

Викенс, Томас Д. (2001). Элементарная теория обнаружения сигналов . ОУП США. гл. 2, с. 20. ISBN 0-19-509250-3 .

Внешние ссылки

Интерактивное руководство по теории обнаружения сигналов, включая расчет d ′.

Эта обработке сигналов статья, посвященная , незавершена . Вы можете помочь Википедии, расширив ее .

Эта статистике статья, посвященная , незавершена . Вы можете помочь Википедии, расширив ее .

[Das-1] Jump up to: ^а ^б ^с ^д ^и ^ж ^г ^час ^я ^дж ^к ^л ^м ^н ^тот ^п ^д ^р ^с Дас, Абранил; Уилсон С. Гейслер (2020). «Методы интеграции мультинормальных чисел и вычисления мер классификации». arXiv : 2012.14331 [ stat.ML ].

[MandC-2] Макмиллан, Н.; Крилман, К. (2005). Теория обнаружения: Руководство пользователя . Лоуренс Эрлбаум Ассошиэйтс. ISBN 9781410611147 .

[SandF-3] Jump up to: ^а ^б Симпсон, Эй Джей; Фиттер, MJ (1973). «Каков наилучший показатель обнаруживаемости?». Психологический вестник . 80 (6): 481–488. дои : 10.1037/h0035203 .

[1]

[2]

[3]