Установить балансировку
Эта статья нуждается в дополнительных цитатах для проверки . ( декабрь 2015 г. ) |
Проблема балансировки множеств в математике — это проблема разделения множества на два подмножества, имеющих примерно одинаковые характеристики. Оно естественным образом возникает при планировании экспериментов . [1] : 71–72
Есть группа предметов. Каждый предмет имеет несколько особенностей, которые считаются бинарными. Например: каждый субъект может быть как молодым, так и старым; либо черный, либо белый; либо высокий, либо низкий; и т. д. Цель состоит в том, чтобы разделить субъектов на две подгруппы: группу лечения (T) и контрольную группу (C), так, чтобы для каждого признака количество субъектов, имеющих этот признак в T, было примерно равно количеству у испытуемых, у которых есть эта особенность в CEg, в обеих группах должно быть примерно одинаковое количество молодых людей, одинаковое количество чернокожих, одинаковое количество высоких людей и т. д.
Матричное представление
[ редактировать ]Формально задачу балансировки множества можно описать следующим образом.
количество субъектов в общей популяции.
это количество потенциальных функций.
Предметы описаны , матрица с записями в . Каждый столбец представляет предмет, а каждая строка представляет функцию. если предмет имеет функцию , и если предмет не имеет функции .
Разделение на группы описывается , вектор с записями в . если предмет находится в группе лечения Т и является предметом находится в контрольной группе С.
Баланс функций описывается . Это вектор. Числовое значение это дисбаланс в характеристиках : если тогда есть еще предметы с в T и если тогда есть еще предметы с в С.
Дисбаланс данного раздела определяется как:
Задача балансировки множеств состоит в нахождении вектора что минимизирует дисбаланс .
Рандомизированный алгоритм
[ редактировать ]Приблизительное решение можно найти с помощью следующего очень простого рандомизированного алгоритма :
- Отправьте каждого субъекта в группу лечения с вероятностью 1/2.
В матричной формулировке:
- Выбери элементы из случайным образом с вероятностью 1/2 для каждого значения в {1,-1}.
Удивительно, но этот алгоритм полностью игнорирует матрицу достигается небольшой дисбаланс с высокой вероятностью , при наличии большого количества функций . Формально для случайного вектора :
ДОКАЗАТЕЛЬСТВО:
Позволять быть общим количеством предметов, которые имеют особенность (эквивалентно количеству единиц в -я матрица ). Рассмотрим следующие два случая:
Простой случай: . Тогда с вероятностью 1 дисбаланс признака (что мы отметили ) не более .
Трудный случай: . Для каждого , позволять . Каждый такой — случайная величина, которая может иметь значение 1 или -1 с вероятностью 1/2. Дисбаланс в характеристиках является: . Поскольку являются независимыми случайными величинами по границе Чернова для каждого :
Выбирать: и получите:
Союзом связанным ,
- .
Ссылки
[ редактировать ]- ^ Митценмахер, Майкл и Упфал, Эли (2005). Вероятность и вычисления: рандомизированные алгоритмы и вероятностный анализ . Издательство Кембриджского университета. ISBN 0-521-83540-2 .