Jump to content

Установить балансировку

Проблема балансировки множеств в математике — это проблема разделения множества на два подмножества, имеющих примерно одинаковые характеристики. Оно естественным образом возникает при планировании экспериментов . [1] : 71–72 

Есть группа предметов. Каждый предмет имеет несколько особенностей, которые считаются бинарными. Например: каждый субъект может быть как молодым, так и старым; либо черный, либо белый; либо высокий, либо низкий; и т. д. Цель состоит в том, чтобы разделить субъектов на две подгруппы: группу лечения (T) и контрольную группу (C), так, чтобы для каждого признака количество субъектов, имеющих этот признак в T, было примерно равно количеству у испытуемых, у которых есть эта особенность в CEg, в обеих группах должно быть примерно одинаковое количество молодых людей, одинаковое количество чернокожих, одинаковое количество высоких людей и т. д.

Матричное представление

[ редактировать ]

Формально задачу балансировки множества можно описать следующим образом.

количество субъектов в общей популяции.

это количество потенциальных функций.

Предметы описаны , матрица с записями в . Каждый столбец представляет предмет, а каждая строка представляет функцию. если предмет имеет функцию , и если предмет не имеет функции .

Разделение на группы описывается , вектор с записями в . если предмет находится в группе лечения Т и является предметом находится в контрольной группе С.

Баланс функций описывается . Это вектор. Числовое значение это дисбаланс в характеристиках : если тогда есть еще предметы с в T и если тогда есть еще предметы с в С.

Дисбаланс данного раздела определяется как:

Задача балансировки множеств состоит в нахождении вектора что минимизирует дисбаланс .

Рандомизированный алгоритм

[ редактировать ]

Приблизительное решение можно найти с помощью следующего очень простого рандомизированного алгоритма :

Отправьте каждого субъекта в группу лечения с вероятностью 1/2.

В матричной формулировке:

Выбери элементы из случайным образом с вероятностью 1/2 для каждого значения в {1,-1}.

Удивительно, но этот алгоритм полностью игнорирует матрицу достигается небольшой дисбаланс с высокой вероятностью , при наличии большого количества функций . Формально для случайного вектора :

ДОКАЗАТЕЛЬСТВО:

Позволять быть общим количеством предметов, которые имеют особенность (эквивалентно количеству единиц в -я матрица ). Рассмотрим следующие два случая:

Простой случай: . Тогда с вероятностью 1 дисбаланс признака (что мы отметили ) не более .

Трудный случай: . Для каждого , позволять . Каждый такой — случайная величина, которая может иметь значение 1 или -1 с вероятностью 1/2. Дисбаланс в характеристиках является: . Поскольку являются независимыми случайными величинами по границе Чернова для каждого :

Выбирать: и получите:

Союзом связанным ,

.
  1. ^ Митценмахер, Майкл и Упфал, Эли (2005). Вероятность и вычисления: рандомизированные алгоритмы и вероятностный анализ . Издательство Кембриджского университета. ISBN  0-521-83540-2 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 0bf04a9b7f9621f9bd5c5a9ca064bc71__1685952840
URL1:https://arc.ask3.ru/arc/aa/0b/71/0bf04a9b7f9621f9bd5c5a9ca064bc71.html
Заголовок, (Title) документа по адресу, URL1:
Set balancing - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)