Jump to content

Несоответствие соотношения выборки

При планировании экспериментов ( несоответствие соотношения выборки SRM ) представляет собой статистически значимую разницу между ожидаемым и фактическим соотношением размеров экспериментальной и контрольной групп в эксперименте. Несоответствие соотношения выборки, также известное как несбалансированная выборка. [ 1 ] часто происходят в онлайн- контролируемых экспериментах из-за ошибок в рандомизации и аппаратуре . [ 2 ]

Несоответствие соотношения выборок можно обнаружить с помощью теста хи-квадрат . [ 3 ] Использование методов обнаружения SRM может помочь неспециалистам избежать дискуссий с использованием предвзятых данных. [ 4 ] Если размер выборки достаточно велик, даже небольшое расхождение между наблюдаемым и ожидаемым размером группы может сделать результаты эксперимента недействительными. [ 5 ] [ 6 ]

Предположим, мы запускаем A/B-тест , в котором случайным образом распределяем 1000 пользователей в экспериментальную и контрольную группы одинакового размера (разделение 50–50). Ожидаемый размер каждой группы — 500 человек. Однако фактические размеры экспериментальной и контрольной групп составляют 600 и 400 человек.

Используя Пирсона по хи-квадрату критерий согласия , мы находим несоответствие соотношения выборки со значением p 2,54 × 10. -10 . Другими словами, если бы распределение пользователей было действительно случайным, вероятность того, что эти размеры экспериментальной и контрольной групп возникнут случайно, равна 2,54 × 10. -10 . [ 7 ]

  1. ^ Эстеллер-Кукала, Мария; Фернандес, Висенс; Виллуэндас, Диего (6 июня 2019 г.). «Ошибки экспериментирования, которых следует избегать при A/B-тестировании онлайн-персонализации» . Дополнительная публикация 27-й конференции по моделированию, адаптации и персонализации пользователей . АКМ. стр. 153–159. дои : 10.1145/3314183.3323853 . ISBN  978-1-4503-6711-0 . S2CID   190007129 .
  2. ^ Фабижан, Александр; Гупчуп, Джаянт; Гупта, Сомит; Омховер, Джефф; Цинь, Вэнь; Вермеер, Лукас; Дмитриев, Павел (25 июля 2019 г.). «Диагностика несоответствия соотношения выборок в онлайн-контролируемых экспериментах» . Материалы 25-й Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных . АКМ. стр. 2156–2164. дои : 10.1145/3292500.3330722 . ISBN  978-1-4503-6201-6 . S2CID   196199621 .
  3. ^ Не, Кейю; Чжан, Цзэчжун; Сюй, Бинцюань; Юань, Тао (17 октября 2022 г.). «Обеспечение качества A/B-тестирования в масштабе с помощью автоматической проверки рандомизации и обнаружения несоответствия соотношения выборок» . Материалы 31-й Международной конференции ACM по управлению информацией и знаниями . АКМ. стр. 3391–3399. arXiv : 2208.07766 . дои : 10.1145/3511808.3557087 . ISBN  978-1-4503-9236-5 . S2CID   251594683 .
  4. ^ Вермеер, Лукас; Андерсон, Кевин; Асебаль, Маурисио (13 июня 2022 г.). «Автоматическое обнаружение и анализ несоответствия соотношения выборок (SRM)» . Международная конференция по оценке и оценке в программной инженерии 2022 . АКМ. стр. 268–269. дои : 10.1145/3530019.3534982 . ISBN  978-1-4503-9613-4 . S2CID   249579055 .
  5. ^ Фабижан, Александр; Гупчуп, Джаянт; Гупта, Сомит; Омховер, Джефф; Цинь, Вэнь; Вермеер, Лукас; Дмитриев, Павел (2019). «Диагностика несоответствия соотношения выборок в контролируемых онлайн-экспериментах: таксономия и практические правила для практиков» (PDF) . Материалы 25-й Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных . стр. 2156–2164. дои : 10.1145/3292500.3330722 . ISBN  9781450362016 . S2CID   196199621 .
  6. ^ Кохави, Рон; Томке, Стефан (1 сентября 2017 г.). «Удивительная сила онлайн-экспериментов» . Гарвардское деловое обозрение . ISSN   0017-8012 . Проверено 19 мая 2023 г.
  7. ^ Вермеер, Лукас. «Часто задаваемые вопросы» . SRM-проверка . Проверено 15 сентября 2022 г.


Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: e37707562ba5de27fb7bd00f6f3065a1__1693004760
URL1:https://arc.ask3.ru/arc/aa/e3/a1/e37707562ba5de27fb7bd00f6f3065a1.html
Заголовок, (Title) документа по адресу, URL1:
Sample ratio mismatch - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)