Jump to content

Вверх-вниз дизайн

(Перенаправлено из «Дизайн вверх и вниз» )

Планы «вверх-вниз» (UDD) — это семейство планов статистических экспериментов, используемых в экспериментах по определению дозы в науке, технике и медицинских исследованиях. Эксперименты по подбору дозы имеют бинарные ответы : каждый отдельный результат можно описать как одно из двух возможных значений, например, успех или неудача или токсичность или нетоксичность. Математически бинарные реакции кодируются как 1 и 0. Цель экспериментов по определению дозы состоит в том, чтобы оценить силу воздействия (т. е. «дозу»), которая вызовет реакцию «1» в заранее заданный пропорции времени. Эту дозу можно представить как порогов ответа процентиль распределения . Примером использования определения дозы является эксперимент по оценке LD 50 некоторого токсичного химического вещества по отношению к мышам.

Смоделированные эксперименты с тремя разными UDD. Ответы 0 и 1 отмечены символами o и x соответственно. Сверху вниз: исходный «простой» UDD, нацеленный на медиану, UDD со смещенной монетой Дарема-Флурного, нацеленный примерно на процентиль 20,6%, и последующий / «трансформированный» UDD, нацеленный на тот же процентиль.

Схемы определения дозы являются последовательными и адаптивными к реакции: доза в данный момент эксперимента зависит от предыдущих результатов, а не фиксируется априори . Планы определения дозы, как правило, более эффективны для этой задачи, чем фиксированные планы, но их свойства сложнее анализировать, а для некоторых требуется специальное программное обеспечение для проектирования. В UDD используется дискретный набор доз, а не непрерывное изменение дозы. Их относительно просто реализовать, а также они являются одними из наиболее изученных методов определения дозы. Несмотря на эту простоту, UDD генерируют случайные блуждания со сложными свойствами. [1] Первоначальный UDD был направлен на определение медианного порога путем увеличения дозы на один уровень после ответа «0» и уменьшения ее на один уровень после ответа «1». Отсюда и название «вверх и вниз». Другие UDD нарушают эту симметрию, чтобы оценивать процентили, отличные от медианы, или могут обрабатывать группы субъектов, а не по одному.

UDD были разработаны в 1940-х годах несколькими независимыми исследовательскими группами. [2] [3] [4] В 1950-е и 1960-е годы произошла быстрая диверсификация: UDD были ориентированы на процентили, отличные от медианы, и распространились на многочисленные прикладные области. В 1970-х - начале 1990-х годов исследования методов UDD проводились мало, хотя эта конструкция продолжала широко использоваться. Возрождение исследований UDD с 1990-х годов обеспечило более глубокое понимание UDD и их свойств. [5] и новые, более совершенные методы оценки. [6] [7]

UDD до сих пор широко используются в двух приложениях, для которых они изначально были разработаны: психофизике , где они используются для оценки сенсорных порогов и часто известны как фиксированные лестничные процедуры принудительного выбора ; [8] и тестирование взрывной чувствительности, где UDD с ориентацией на медиану часто называют тестом Брюстона . UDD также очень популярны в исследованиях токсичности и анестезиологии. [9] Они также считаются жизнеспособным выбором для клинических испытаний фазы I. [10]

Математическое описание [ править ]

Определение [ править ]

Позволять будет размер выборки эксперимента UDD, и на данный момент предполагается, что испытуемых лечат по одному. Тогда дозы, которые получают эти субъекты, обозначаются как случайные величины. , выбираются из дискретного конечного набора повышение уровня дозы Кроме того, если , затем по простым постоянным правилам, основанным на недавних ответах. Следующий объект должен рассматриваться на один уровень выше, на один уровень ниже или на том же уровне, что и текущий объект. Сами ответы обозначаются в дальнейшем ответы «1» являются положительными, а «0» — отрицательными. Повторное применение одних и тех же правил (известных как правила перехода дозы ) к конечному набору уровней дозы приводит к в случайное блуждание . Различные правила перехода дозы создают разные «ароматы» УДА, такие как три, показанные на рисунке выше.

Несмотря на то, что в эксперименте использовался только дискретный набор уровней дозы, сама переменная величина дозы , предполагается непрерывным, а вероятность положительного ответа непрерывно возрастает с увеличением . Целью экспериментов по определению дозы является оценка дозы (по непрерывной шкале), которые вызовут положительные ответы с заранее установленной целевой скоростью ; часто известный как «целевая доза». Эту проблему можно также выразить как оценку квантиля кумулятивной функции распределения, описывающей кривую доза-токсичность . Функция плотности связанный с интерпретируется как распределение порогов ответа исследуемой популяции.

Матрица вероятностей перехода [ править ]

Учитывая, что субъект получает дозу , обозначают вероятность того, что следующий субъект получит дозу , или , как или , соответственно. Эти вероятности перехода подчиняются ограничениям и граничные условия .

Каждый конкретный набор правил UDD позволяет символически вычислить эти вероятности, обычно как функцию . Предполагая, что вероятности перехода фиксированы во времени и зависят только от текущего распределения и его результата, т. е. от и через них на (и, возможно, по набору фиксированных параметров). Тогда вероятности лучше всего представляются через трехдиагональную матрицу вероятностей перехода (TPM). :

Точка баланса [ править ]

Обычно правила изменения дозы UDD снижают дозу (или, по крайней мере, предотвращают ее повышение) после положительных ответов, и наоборот. Следовательно, случайные блуждания UDD имеют центральную тенденцию: назначение доз имеет тенденцию колебаться взад и вперед вокруг некоторой дозы. которые можно вычислить на основе правил перехода, если они выражены как функция . [1] Эту дозу часто путают с формальной целью эксперимента. , и они часто идентичны, но это не обязательно. Целью является доза, которую предстоит оценить в ходе эксперимента, в то время как , известная как «точка баланса», примерно соответствует тому месту, вокруг которого вращается случайное блуждание UDD. [11]

Стационарное распределение распределения доз [ править ]

Поскольку случайные блуждания UDD представляют собой регулярные цепи Маркова , они генерируют стационарное распределение распределения доз, , как только пройдет эффект от выбранной вручную начальной дозы. Это означает, что частота долгосрочных посещений различных доз будет приближаться к устойчивому состоянию, описываемому формулой . Согласно теории цепей Маркова, эффект стартовой дозы проходит довольно быстро, с геометрической скоростью. [12] Численные исследования показывают, что обычно это занимает от и предметы, чтобы эффект почти полностью исчез. [11] также является асимптотическим распределением распределения кумулятивной дозы.

Центральные тенденции UDD гарантируют, что долгосрочная, наиболее часто посещаемая доза (т. е способ . ) будет одной из двух доз, наиболее близких к точке равновесия. . [1] Если находится вне диапазона допустимых доз, то режим будет на ближайшей к нему границе дозы. При исходном UDD для определения медианы режим будет при дозе, наиболее близкой к в любом случае. Вдали от режима асимптотические частоты посещений резко уменьшаются со скоростью, превышающей геометрическую. Несмотря на то, что эксперимент UDD по-прежнему представляет собой случайное блуждание, дальние отклонения от интересующей области очень маловероятны.

Примеры стационарных распределений UDD с . Слева: оригинальный («классический») УДА, . Справа: предвзятая монета, нацеленная на 30-й процентиль,

Общие UDD [ править ]

Оригинальный («простой» или «классический») UDD [ править ]

Оригинальный «простой» или «классический» УДА увеличивает дозу на один уровень при отрицательной реакции, и наоборот. Следовательно, вероятности перехода равны

Мы используем исходный UDD в качестве примера для расчета точки баланса. . Функции дизайна «вверх», «вниз»: Приравниваем их, чтобы найти :

«Классический» UDD предназначен для нахождения медианного порога. Это тот случай, когда

«Классический» UDD можно рассматривать как частный случай каждой из более универсальных конструкций, описанных ниже.

Флурнуа Предвзятый дизайн монет Дарема и

Этот UDD смещает точку баланса, добавляя возможность лечения следующего субъекта той же дозой, а не только вверх или вниз. Остаться ли, определяется случайным подбрасыванием метафорической «монеты» с вероятностью Этот дизайн смещенной монеты (BCD) имеет два «аромата», один для и один для чьи правила показаны ниже:

Вероятность выпадения орла может принимать любое значение в . Точка баланса – это

Точку баланса BCD можно сделать идентичной целевой ставке. установив вероятность выпадения орла на . Например, для набор . Параметр делает этот дизайн идентичным классическому UDD, а инвертирование правил путем навязывания подбрасывания монеты положительным, а не отрицательным результатам, дает точки баланса выше среднего. Также были опубликованы версии с двумя монетами, по одной для каждого результата, но они, похоже, не дают преимущества перед более простым BCD с одной монетой.

Групповые (когортные) UDD [ править ]

Некоторые эксперименты по подбору дозы, такие как испытания фазы I, требуют периода ожидания в несколько недель, прежде чем определить каждый отдельный результат. В этом случае может быть предпочтительнее иметь возможность лечить несколько пациентов одновременно или в быстрой последовательности. В случае групповых UDD правила перехода применяются к когортам фиксированного размера. а не отдельным лицам. становится дозой, полученной когортой , и количество положительных ответов в -ая когорта, а не бинарный результат. Учитывая, что -я когорта проходит лечение в в интерьере тот -ая когорта отнесена к

следовать биномиальному распределению, обусловленному , с параметрами и . Вероятности вверх и вниз — это хвосты биномиального распределения, а вероятность пребывания — это центр (она равна нулю, если ). Конкретный выбор параметров может быть сокращенно обозначен как GUD.

Номинально групповые UDD генерируют -упорядочить случайные блуждания, так как самые последние наблюдения необходимы для определения следующего распределения. Однако, поскольку когорты рассматриваются как отдельные математические объекты, эти планы генерируют случайное блуждание первого порядка с трехдиагональным TPM, как указано выше. Некоторые соответствующие групповые подсемейства UDD:

  • Симметричные конструкции с (например, БОГ ) ориентируйтесь на медиану.
  • Семья ГУД встречающийся в исследованиях токсичности, допускает эскалацию только при отсутствии положительных ответов и деэскалацию при любом положительном ответе. Вероятность эскалации при является а так как данная конструкция не позволяет оставаться в одной и той же дозе, то в точке равновесия она будет ровно . Поэтому,

С будет связан с и , соответственно. Зеркальное семейство ГУД имеет точки равновесия, равные единице минус эти вероятности.

Для общегрупповых УДА точку равновесия можно рассчитать только численно, найдя дозу со степенью токсичности такой, что

Любой численный алгоритм поиска корня, например, Ньютона-Рафсона , может быть использован для решения . [13]

-в ряд (или «трансформированный», или «геометрический») UDD [ править ]

Это наиболее часто используемый немедианный UDD. Он был представлен компанией Wetherill в 1963 году. [14] и вскоре после этого он и его коллеги распространили его на психофизику, [15] где он остается одним из стандартных методов определения сенсорных порогов. [8] Уэтерилл назвал это «преобразованным» UDD; Мисрак Гезму , который первым проанализировал его свойства случайного блуждания, в 1990-х годах назвал его «геометрическим» UDD; [16] а в 2000-х более прямолинейное название " -в ряд» УДД был принят на вооружение. [11] Правила дизайна обманчиво просты:

Любое повышение дозы требует отсутствие токсичности наблюдалось в последовательных точках данных, все при текущей дозе, тогда как для деэскалации требуется только одна токсичность. Очень похоже на GUD описано выше, и действительно имеет одну и ту же точку баланса. Разница в том, что -в-ряд может выйти из уровня дозы при первой токсичности, тогда как его групповой брат UDD может лечить всю когорту сразу и, следовательно, может увидеть более одной токсичности, прежде чем спуститься.

Метод, используемый в сенсорных исследованиях, на самом деле является зеркальным отражением метода, определенного выше, с последовательные ответы, необходимые для деэскалации, и только один отказ от ответа на эскалацию, что дает для . [17]

-в-ряде генерирует Случайное блуждание -го порядка, поскольку знание последнего могут потребоваться ответы. Ее можно представить в виде цепи первого порядка с состояний, или как цепь Маркова с уровни, каждый из которых имеет внутренние состояния, помеченные к Внутреннее состояние служит счетчиком количества непосредственно недавних последовательных нетоксичных явлений, наблюдаемых при текущей дозе. Это описание ближе к физическому процессу распределения дозы, поскольку субъекты находятся в разных внутренних состояниях уровня всем назначена одна и та же доза . В любом случае, TPM (или точнее, , потому что внутренний счетчик бессмысленен при максимальной дозе) - и он не трехдиагональный.

Вот расширенный вариант -в-рядном TPM с и , используя сокращение Внутренние состояния каждого уровня соседствуют друг с другом.

Последовательное введение часто рассматривается для клинических испытаний, нацеленных на получение малотоксичной дозы. В этом случае точка баланса и цель не идентичны; скорее, выбирается так, чтобы приблизиться к целевой ставке, например, для исследований, нацеленных на 30-й процентиль, и для исследований, нацеленных на 20-й процентиль.

Оценка целевой дозы [ править ]

Пример оценки методом обратного усреднения психофизического эксперимента. Точки разворота обведены кружком, а первый разворот был исключен из средней. Конструкция двухступенчатая, со второй (и основной) ступенью. - подряд с таргетингом на процентиль 70,7%. На первом этапе (до первого разворота) используется «классический» UDD — широко используемая схема ускорения прибытия в интересующую область.

В отличие от других подходов к проектированию, UDD не имеют конкретного метода оценки, «включенного» в проект в качестве выбора по умолчанию. Исторически более распространенным выбором было некое средневзвешенное значение введенных доз, обычно исключающее первые несколько доз, чтобы смягчить ошибку начальной точки. Этот подход предшествует более глубокому пониманию марковских свойств UDD, но его успех в числовых оценках зависит от возможной выборки из , поскольку последний сосредоточен примерно вокруг [5]

Самая популярная среди этих оценок усреднения была предложена Wetherill et al. в 1966 году и включает в среднее значение только точки разворота (точки, когда результат меняется с 0 на 1 или наоборот). [18] В последние годы выявились ограничения оценок усреднения, в частности, многочисленные источники систематической ошибки, которые очень трудно устранить. Реверсивные оценки страдают как от множественных систематических ошибок (хотя есть некоторая непреднамеренная компенсация систематических ошибок), так и от повышенной дисперсии из-за использования подвыборки доз. Однако знания об ограничениях усредняющих оценок еще не получили распространения за пределами методологической литературы и не повлияли на реальную практику. [5]

Напротив, средства регрессионной оценки пытаются аппроксимировать кривую описывающее зависимость «доза-реакция» , в частности, вокруг целевого процентиля. Исходными данными для регрессии являются дозы по горизонтальной оси и наблюдаемые частоты токсичности,

на вертикальной оси. Целевая оценка — это абсцисса точки, в которой подобранная кривая пересекает

Пробит-регрессия использовалась на протяжении многих десятилетий для оценки целей UDD, хотя и гораздо реже, чем оценка с обратным усреднением. В 2002 году Стилиану и Флурной представили интерполированную версию изотонической регрессии (IR) для оценки целевых показателей UDD и других данных о зависимости дозы. [6] Совсем недавно Орон и Флурнуа разработали модификацию под названием «центрированная изотоническая регрессия» (CIR), обещавшую в большинстве случаев значительно лучшую производительность оценки, чем обычная изотоническая регрессия, а также предлагающую первый жизнеспособный интервальный оценщик для изотонической регрессии в целом. [7] Оценщики изотонической регрессии кажутся наиболее совместимыми с UDD, поскольку оба подхода являются непараметрическими и относительно надежными. [5] Общедоступный пакет R «cir» реализует как CIR, так и IR для определения дозы и других приложений. [19]

Ссылки [ править ]

  1. ^ Jump up to: Перейти обратно: а б с Дарем, Южная Дакота; Флурнуа, Н. «Дизайны вверх и вниз. I. Стационарные распределения лечения». В Флурнуа, Н.; Розенбергер, В.Ф. (ред.). Серия монографий IMS «Конспекты лекций» . Том. 25: Адаптивный дизайн. стр. 139–157.
  2. ^ Диксон, штат Вашингтон; Настроение, А.М. (1948). «Метод получения и анализа данных о чувствительности». Журнал Американской статистической ассоциации . 43 (241): 109–126. дои : 10.1080/01621459.1948.10483254 .
  3. ^ фон Бекеши, Г (1947). «Новый аудиометр». Acta Oto-Laryngologica . 35 (5–6): 411–422. дои : 10.3109/00016484709123756 .
  4. ^ Андерсон, ТВ; Маккарти, Пи Джей; Тьюки, JW (1946). Метод определения чувствительности «Лестница» (Технический отчет). Отчет о военно-морских артиллерийских вооружениях. 65-46.
  5. ^ Jump up to: Перейти обратно: а б с д Флурнуа, Н; Орон, АП. «Дизайны вверх и вниз для определения дозы». В Дин, А. (ред.). Справочник по планированию и анализу экспериментов . ЦРК Пресс. стр. 858–894.
  6. ^ Jump up to: Перейти обратно: а б Стилиану, член парламента; Флурной, Н. (2002). «Определение дозы с использованием смещенной модели монеты вверх и вниз и изотонической регрессии». Биометрия . 58 (1): 171–177. дои : 10.1111/j.0006-341x.2002.00171.x . ПМИД   11890313 . S2CID   8743090 .
  7. ^ Jump up to: Перейти обратно: а б Орон, АП; Флурнуа, Н. (2017). «Центрированная изотоническая регрессия: точечная и интервальная оценка для исследований зависимости доза-эффект». Статистика биофармацевтических исследований . 9 (3): 258–267. arXiv : 1701.05964 . дои : 10.1080/19466315.2017.1286256 . S2CID   88521189 .
  8. ^ Jump up to: Перейти обратно: а б Лик, MR (2001). «Адаптивные процедуры в психофизических исследованиях» . Восприятие и психофизика . 63 (8): 1279–1292. дои : 10.3758/bf03194543 . ПМИД   11800457 .
  9. ^ Пейс, Нидерланды; Стилиану, член парламента (2007). «Достижения и ограничения методологии вверх и вниз: особенности клинического использования, дизайн исследования и оценка дозы в исследованиях анестезии» . Анестезиология . 107 (1): 144–152. дои : 10.1097/01.anes.0000267514.42592.2a . ПМИД   17585226 .
  10. ^ Орон, АП; Хофф, П.Д. (2013). «Поведение малой выборки новых дизайнов исследований рака фазы I». Клинические испытания . 10 (1): 63–80. arXiv : 1202.4962 . дои : 10.1177/1740774512469311 . ПМИД   23345304 . S2CID   5667047 .
  11. ^ Jump up to: Перейти обратно: а б с Орон, АП; Хофф, П.Д. (2009). «Еще раз о дизайне с движением вверх и вниз». Статистика в медицине . 28 (13): 1805–1820. дои : 10.1002/сим.3590 . ПМИД   19378270 . S2CID   25904900 .
  12. ^ Диаконис, П; Строк, Д. (1991). «Геометрические оценки собственных значений цепи Маркова» . Анналы прикладной теории вероятности . 1 : 36–61. дои : 10.1214/aoap/1177005980 .
  13. ^ Гезму, М ; Флурной, Н. (2006). «Группируйте конструкции вверх и вниз для определения дозы». Журнал статистического планирования и выводов . 136 (6): 1749–1764. дои : 10.1016/j.jspi.2005.08.002 .
  14. ^ Уэтерилл, Великобритания; Левитт, Х (1963). «Последовательная оценка кривых квантового отклика». Журнал Королевского статистического общества, серия B. 25 : 1–48. дои : 10.1111/j.2517-6161.1963.tb00481.x .
  15. ^ Уэтерилл, Великобритания (1965). «Последовательная оценка баллов психометрической функции». Британский журнал математической и статистической психологии . 18 : 1–10. дои : 10.1111/j.2044-8317.1965.tb00689.x . ПМИД   14324842 .
  16. ^ Гезму, Мисрак (1996). Геометрический дизайн вверх и вниз для распределения уровней дозировки (доктор философии). Американский университет.
  17. ^ Гарсия-Перес, Массачусетс (1998). «Лестницы принудительного выбора с фиксированными размерами ступенек: асимптотические и маловыборочные свойства» . Исследование зрения . 38 (12): 1861–81. дои : 10.1016/s0042-6989(97)00340-4 . ПМИД   9797963 .
  18. ^ Уэтерилл, Великобритания; Чен, Х; Васудева, РБ (1966). «Последовательная оценка кривых квантового отклика: новый метод оценки». Биометрика . 53 (3–4): 439–454. дои : 10.1093/biomet/53.3-4.439 .
  19. ^ Орон, Ассаф. «Пакет 'цир' » . КРАН . R Фонд статистических вычислений . Проверено 26 декабря 2020 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 88586af1f818c5d0a99880f35534ff78__1713793800
URL1:https://arc.ask3.ru/arc/aa/88/78/88586af1f818c5d0a99880f35534ff78.html
Заголовок, (Title) документа по адресу, URL1:
Up-and-down design - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)