Jump to content

Статистический бенчмаркинг

В статистике используемых бенчмаркинг — это метод использования вспомогательной информации для корректировки весов выборки, в процессе оценки , с целью получения более точных оценок итоговых показателей.

Предположим, у нас есть популяция , в которой каждая единица имеет «ценность» связанный с этим. Например, может быть зарплата работника или стоимость товара . Предположим, мы хотим оценить сумму из всех . , мы берем образец Итак , получите вес выборки W ( k ) для всех выбранных , а затем суммируем для всех выборок .

Одно свойство, обычно общее для гирь описанное здесь, заключается в том, что если мы суммируем их по всем выборкам , то эта сумма является оценкой общего количества единиц в популяции (например, общая занятость или общее количество единиц). Поскольку у нас есть выборка, эта оценка общего количества единиц в совокупности будет отличаться от истинной общей численности населения. Аналогично, оценка общего количества (где мы суммируем для всех выборок ) также будет отличаться от истинной численности населения.

Мы не знаем, какова истинная численность населения значение (если бы мы это сделали, выборка не имела бы смысла!). Однако часто мы знаем, какова сумма охватывают все единицы генеральной совокупности. Например, мы можем не знать общий доход населения или общие затраты населения, но часто мы знаем общую занятость или общий объем продаж. И даже если мы не знаем их точно, часто существуют исследования, проведенные другими организациями или в более раннее время, с очень точными оценками этих вспомогательных величин. населения Одной из важных функций переписи является предоставление данных, которые можно использовать для сравнительного анализа небольших обследований.

Процедура сравнительного анализа начинается с разбиения популяции на контрольные ячейки. Ячейки образуются путем группировки единиц, имеющих общие характеристики, например схожие. , однако можно использовать все, что повышает точность окончательных оценок. Для каждой ячейки , мы позволяем быть суммой всех , где сумма берется по всем выборкам в камере . Для каждой ячейки , мы позволяем быть вспомогательным значением для ячейки , который обычно называют «целевым показателем» для ячейки . Далее мы вычисляем эталонный коэффициент . Затем мы корректируем все веса умножив его на эталонный коэффициент , для своей ячейки . Конечным результатом является то, что предполагаемый [образуется путем суммирования ] теперь будет равняться контрольному целевому итогу . Но более важным преимуществом является то, что оценка общей суммы [образуется путем суммирования ] будет более точным.

Связь со стратифицированной выборкой

[ редактировать ]

Бенчмаркинг иногда называют «пост-стратификацией» из-за его сходства со стратифицированной выборкой . Разница между ними заключается в том, что при стратифицированной выборке мы заранее решаем, сколько единиц будет отобрано из каждой страты (эквивалентно контрольным ячейкам); при сравнительном анализе мы выбираем единицы из более широкой совокупности, и число, выбранное из каждой ячейки, является делом случая.

Преимущество стратифицированной выборки заключается в том, что количество выборок в каждой страте можно контролировать для достижения желаемой точности. Без этого контроля мы можем получить слишком большую выборку в одной страте и недостаточную в другой – действительно, возможно, что выборка не будет содержать членов из определенной ячейки, и в этом случае сравнительный анализ не удастся, потому что , что приводит к проблеме деления на ноль. В таких случаях необходимо «схлопнуть» ячейки вместе, чтобы каждая оставшаяся ячейка имела адекватный размер выборки.

По этой причине бенчмаркинг обычно используется в ситуациях, когда стратифицированная выборка нецелесообразна. Например, выбирая людей из телефонного справочника, мы не можем сказать, какого они возраста, поэтому мы не можем легко стратифицировать выборку по возрасту. Однако мы можем собирать эту информацию от выбранных людей, что позволяет нам сравнивать ее с демографической информацией.

Дальнейшее чтение

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: a47cac38900af7e572f36710104389d4__1707432000
URL1:https://arc.ask3.ru/arc/aa/a4/d4/a47cac38900af7e572f36710104389d4.html
Заголовок, (Title) документа по адресу, URL1:
Statistical benchmarking - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)