Взвешивание обратной дисперсии
В статистике взвешивание с обратной дисперсией — это метод агрегирования двух или более случайных величин для минимизации дисперсии средневзвешенного значения . Каждая случайная величина имеет вес, обратно пропорциональный ее дисперсии (т. е. пропорциональный ее точности ).
Учитывая последовательность независимых наблюдений y i с дисперсиями σ i 2 , средневзвешенное значение обратной дисперсии определяется выражением [1]
Средневзвешенное значение с обратной дисперсией имеет наименьшую дисперсию среди всех средневзвешенных значений, которую можно рассчитать как
Если все дисперсии измерений равны, то взвешенное среднее с обратной дисперсией становится простым средним.
Взвешивание обратной дисперсии обычно используется в статистическом метаанализе или объединении датчиков для объединения результатов независимых измерений.
Контекст
[ редактировать ]Предположим, экспериментатор желает измерить значение какой-либо величины, скажем, ускорения силы тяжести Земли , истинное значение которого оказывается равным . Внимательный экспериментатор проводит несколько измерений, которые мы обозначим через случайные величины . Если все они зашумлены, но несмещены, т. е. измерительный прибор систематически не завышает и не занижает истинное значение и ошибки разбросаны симметрично, то математическое ожидание . Тогда разброс измерений характеризуется дисперсией случайных величин. , а если измерения проводятся по идентичным сценариям, то все одинаковы, и мы будем называть их . Учитывая измерения, типичный оценщик для , обозначенный как , определяется простым средним . Обратите внимание, что это эмпирическое среднее значение также является случайной величиной, чье математическое ожидание является но также имеет разброс. Если отдельные измерения некоррелированы, квадрат ошибки оценки определяется выражением . Следовательно, если все равны, то ошибка оценки уменьшается с увеличением как , что делает предпочтительным большее количество наблюдений.
Вместо повторные измерения одним прибором, если экспериментатор производит такого же количества с разные приборы с разным качеством измерений, то нет оснований ожидать разного быть таким же. Некоторые инструменты могут быть более шумными, чем другие. В примере измерения ускорения свободного падения различные «приборы» могут измерять от простого маятника , от анализа движения снаряда и т. д. Простое среднее больше не является оптимальным средством оценки, поскольку ошибка в фактически может превысить ошибку наименее зашумленного измерения, если разные измерения имеют очень разные ошибки. Вместо того, чтобы отбрасывать зашумленные измерения, которые увеличивают окончательную ошибку, экспериментатор может объединить все измерения с соответствующими весами, чтобы придать большее значение измерениям с наименьшим шумом, и наоборот. Учитывая знания о , оптимальная оценка для измерения будет средневзвешенным значением измерений , для конкретного выбора весов . Дисперсия оценки , которые для оптимального выбора весов принимают вид
Обратите внимание, что поскольку , разброс оценщика меньше, чем разброс при любом отдельном измерении. Кроме того, разброс в уменьшается при добавлении дополнительных измерений, какими бы зашумленными ни были эти измерения.
Вывод
[ редактировать ]Рассмотрим общую взвешенную сумму , где веса нормированы так, что . Если все независимы, дисперсия дается (см. тождество Бьенеме )
Для оптимальности мы хотим минимизировать что можно сделать, приравняв градиент по весам к нулю, сохраняя при этом ограничение, что . Использование множителя Лагранжа чтобы обеспечить соблюдение ограничения, мы выражаем дисперсию:
Для ,
что подразумевает, что:
Главный вывод здесь заключается в том, что . С ,
Индивидуальные нормализованные веса:
Легко увидеть, что это экстремальное решение соответствует минимуму из второго теста частной производной, если отметить, что дисперсия является квадратичной функцией весов. Таким образом, минимальная дисперсия оценки определяется следующим образом:
Нормальные распределения
[ редактировать ]Для нормально распределенных случайных величин также можно получить средневзвешенные значения с обратной дисперсией как оценку максимального правдоподобия для истинного значения. Более того, с байесовской точки зрения апостериорное распределение истинного значения при нормально распределенных наблюдениях а плоское априорное распределение представляет собой нормальное распределение со средневзвешенным значением обратной дисперсии в качестве среднего и дисперсии.
Многомерный случай
[ редактировать ]Для многомерных распределений эквивалентный аргумент приводит к оптимальному взвешиванию на основе ковариационных матриц. отдельных векторных оценок :
Для многомерных распределений чаще используется термин «точно-взвешенное» среднее.
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Иоахим Хартунг; Гвидо Кнапп; Бимал К. Синха (2008). Статистический метаанализ с приложениями . Джон Уайли и сыновья . ISBN 978-0-470-29089-7 .
Эта статья нуждается в дополнительных цитатах для проверки . ( сентябрь 2012 г. ) |