Функция выживания
Функция выживания — это функция , которая дает вероятность того, что пациент, устройство или другой интересующий объект выживет после определенного времени. [1] Функция выживания также известна как функция выживания. [2] или функция надежности . [3] Термин «функция надежности» широко распространен в технике, тогда как термин «функция выживания» используется в более широком диапазоне применений, включая человеческую смертность. Функция выживания — это дополнительная кумулятивная функция распределения времени жизни. Иногда дополнительные кумулятивные функции распределения вообще называют функциями выживания.
Определение [ править ]
Пусть время жизни T является непрерывной случайной величиной с кумулятивной функцией риска F ( t ) и функцией риска f( t ) на интервале [0,∞). Его функция выживания или функция надежности :
Примеры функций выживания
На графиках ниже показаны примеры гипотетических функций выживания. Ось X — время. По оси Y отложена доля выживших субъектов. Графики показывают вероятность того, что субъект выживет после времени t.
Например, для функции выживания 1 вероятность выжить дольше t = 2 месяцев равна 0,37. То есть 37% испытуемых выживают более 2 месяцев.
Для функции выживания 2 вероятность выжить дольше t = 2 месяцев равна 0,97. То есть 97% субъектов выживают более 2 месяцев.
Медианную выживаемость можно определить с помощью функции выживания: Медианная выживаемость — это точка, в которой функция выживания пересекает значение 0,5. [4] Например, для функции выживания 2 50% субъектов выживают 3,72 месяца. Таким образом, медиана выживаемости составляет 3,72 месяца.
В некоторых случаях медиану выживаемости невозможно определить по графику. Например, для функции выживания 4 более 50% субъектов выживают дольше, чем период наблюдения в 10 месяцев.
Функция выживания — это один из нескольких способов описания и отображения данных о выживании. Еще один полезный способ отображения данных — график, показывающий распределение времени выживания субъектов. Олькин, [5] на странице 426 приведен следующий пример данных о выживании. Регистрировалось количество часов между последовательными отказами системы кондиционирования. Время между последовательными отказами составляет 1, 3, 5, 7, 11, 11, 11, 12, 14, 14, 14, 16, 16, 20, 21, 23, 42, 47, 52, 62, 71, 71, 87, 90, 95, 120, 120, 225, 246 и 261 час. Среднее время наработки на отказ составляет 59,6. Это среднее значение будет вскоре использовано для подгонки теоретической кривой к данным. На рисунке ниже показано распределение времени между отказами. Синие отметки под графиком обозначают фактическое количество часов между последовательными сбоями.
Распределение времени отказов накладывается на кривую, представляющую экспоненциальное распределение. В этом примере экспоненциальное распределение аппроксимирует распределение времени отказов. Экспоненциальная кривая представляет собой теоретическое распределение, соответствующее фактическому времени отказа. Эта конкретная экспоненциальная кривая задается параметром лямбда, λ = 1/(среднее время между отказами) = 1/59,6 = 0,0168. Распределение времен отказов называется функцией плотности вероятности (pdf), если время может принимать любое положительное значение. В уравнениях PDF указывается как f(t). Если время может принимать только дискретные значения (например, 1 день, 2 дня и т. д.), распределение времени отказов называется функцией массы вероятности (pmf). Большинство методов анализа выживаемости предполагают, что время может принимать любое положительное значение, а f(t) — это PDF-файл. Если время между наблюдаемыми отказами кондиционера аппроксимировать с помощью экспоненциальной функции, то экспоненциальная кривая дает функцию плотности вероятности f(t) для времени отказа кондиционера.
Еще один полезный способ отображения данных о выживаемости — это график, показывающий совокупное количество отказов до каждого момента времени. Эти данные могут отображаться либо в виде совокупного числа, либо в виде совокупной доли отказов до каждого раза. На графике ниже показана совокупная вероятность (или доля) отказов системы кондиционирования воздуха в каждый момент времени. Ступенчатая линия черного цвета показывает совокупную долю отказов. Для каждого шага в нижней части графика имеется синяя галочка, указывающая наблюдаемое время отказа. Гладкая красная линия представляет собой экспоненциальную кривую, соответствующую наблюдаемым данным.
График совокупной вероятности отказов до каждого момента времени называется кумулятивной функцией распределения или CDF. В анализе выживания кумулятивная функция распределения дает вероятность того, что время выживания меньше или равно определенному времени t.
Пусть T — время выживания, которое является любым положительным числом. Конкретное время обозначается строчной буквой t. Кумулятивная функция распределения T - это функция
где правая часть представляет вероятность того, что случайная величина T меньше или равна t . Если время может принимать любое положительное значение, то кумулятивная функция распределения F(t) является интегралом функции плотности вероятности f(t).
Для примера с кондиционером график CDF ниже показывает, что вероятность того, что время до отказа меньше или равно 100 часам, составляет 0,81, как оценивается с использованием экспоненциальной кривой, соответствующей данным.
Альтернативой построению графика вероятности того, что время отказа меньше или равно 100 часам, является графическое отображение вероятности того, что время отказа превышает 100 часов. Вероятность того, что время отказа превышает 100 часов, должна быть равна 1 минус вероятность того, что время отказа меньше или равно 100 часам, поскольку общая вероятность должна быть равна 1.
Это дает
P(время отказа > 100 часов) = 1 - P(время отказа < 100 часов) = 1 – 0,81 = 0,19.
Это соотношение распространяется на все времена отказов:
P(T > t) = 1 - P(T < t) = 1 – кумулятивная функция распределения.
Эта зависимость показана на графиках ниже. График слева представляет собой кумулятивную функцию распределения, которая равна P(T <t). График справа: P(T > t) = 1 - P(T < t). График справа представляет собой функцию выживания S(t). Тот факт, что S(t) = 1 – CDF, является причиной того, что другое название функции выживания – дополнительная кумулятивная функция распределения.
выживания Параметрические функции
В некоторых случаях, например в примере с кондиционером, распределение времен выживания может быть хорошо аппроксимировано такой функцией, как экспоненциальное распределение. В анализе выживаемости обычно используются несколько распределений, включая экспоненциальное, Вейбулла, гамма, нормальное, логнормальное и логарифмическое. [3] [6] Эти распределения определяются параметрами. Например, нормальное (гауссово) распределение определяется двумя параметрами: средним и стандартным отклонением. Функции выживания, определяемые параметрами, называются параметрическими.
На четырех графиках функции выживания, показанных выше, форма функции выживания определяется определенным распределением вероятностей: функция выживания 1 определяется экспоненциальным распределением, 2 определяется распределением Вейбулла, 3 определяется логарифмическим логистическим распределением. , а 4 определяется другим распределением Вейбулла.
выживания Экспоненциальная функция
Для экспоненциального распределения выживаемости вероятность отказа одинакова в каждом временном интервале, независимо от возраста человека или устройства. Этот факт приводит к свойству «безпамяти» экспоненциального распределения выживаемости: возраст испытуемого не влияет на вероятность неудачи в следующем временном интервале. Экспонента может быть хорошей моделью срока службы системы, в которой детали заменяются по мере их выхода из строя. [7] Это также может быть полезно для моделирования выживания живых организмов в течение коротких интервалов времени. Вряд ли это будет хорошей моделью полной продолжительности жизни живого организма. [8] В роли Эфрона и Хасти [9] (стр. 134) обратите внимание: «Если бы продолжительность человеческой жизни была экспоненциальной, не было бы старых и молодых людей, а были бы только счастливчики или неудачники».
выживания Функция Вейбулла
Ключевое предположение экспоненциальной функции выживания состоит в том, что уровень риска постоянен. В приведенном выше примере доля мужчин, умирающих каждый год, была постоянной и составляла 10%, а это означает, что уровень опасности был постоянным. Предположение о постоянной опасности может оказаться неприемлемым. Например, среди большинства живых организмов риск смерти в старости выше, чем в среднем возрасте, то есть уровень опасности увеличивается со временем. Для некоторых заболеваний, таких как рак молочной железы, риск рецидива через 5 лет ниже, то есть уровень опасности снижается со временем. Распределение Вейбулла расширяет экспоненциальное распределение, позволяя поддерживать постоянную, возрастающую или уменьшающуюся степень опасности.
выживания параметрические функции Другие
Существует несколько других параметрических функций выживания, которые могут лучше соответствовать конкретному набору данных, включая нормальную, логнормальную, логарифмическую и гамма. Выбор параметрического распределения для конкретного приложения можно осуществить с помощью графических методов или с помощью формальных критериев соответствия.Эти распределения и тесты описаны в учебниках по анализу выживаемости. [1] [3] Лоулесс [10] имеет обширный охват параметрических моделей.
Параметрические функции выживания обычно используются в производственных приложениях, отчасти потому, что они позволяют оценить функцию выживания за пределами периода наблюдения. Однако правильное использование параметрических функций требует, чтобы данные хорошо моделировались выбранным распределением. Если подходящее распределение недоступно или не может быть указано перед клиническим испытанием или экспериментом, полезной альтернативой могут стать непараметрические функции выживания.
Непараметрические функции выживания
Параметрическая модель выживания может оказаться невозможной или нежелательной. В таких ситуациях наиболее распространенным методом моделирования функции выживания является непараметрическая оценка Каплана – Мейера . Для этой оценки требуются данные за весь срок службы. Периодический подсчет случаев (когорт) и смертей (и выздоровлений) статистически достаточен для получения непараметрических оценок функций выживания по методу максимального правдоподобия и наименьших квадратов без данных о времени жизни.
Свойства [ править ]
- Каждая функция выживания , монотонно убывает т.е. для всех .
- Это свойство случайной величины , которая отображает набор событий, обычно связанных со смертностью или отказом какой-либо системы, во времени .
- Время , , представляет собой некое начало, обычно начало исследования или начало работы какой-либо системы. обычно равен единице, но может быть и меньше, чтобы представить вероятность того, что система выйдет из строя сразу после срабатывания.
- Поскольку CDF является непрерывной справа функцией, функция выживания также непрерывно справа.
- Функция выживания может быть связана с функцией плотности вероятности и функция опасности
Так что
- Ожидаемое время выживания
Доказательство формулы ожидаемого времени выживания |
---|
См. также [ править ]
- Частота отказов
- Частота превышения
- Оценщик Каплана – Мейера
- Среднее время до отказа
- Время пребывания (статистика)
- Кривая выживаемости
Ссылки [ править ]
- ^ Jump up to: Перейти обратно: а б Кляйнбаум, Дэвид Г.; Кляйн, Митчел (2012), Анализ выживания: текст для самообучения (Третье изд.), Springer, ISBN 978-1441966452
- ^ Таблеймен, Мара; Ким, Чон Сун (2003), Анализ выживания с использованием S (первое издание), Чепмен и Холл / CRC, ISBN 978-1584884088
- ^ Jump up to: Перейти обратно: а б с Эбелинг, Чарльз (2010), Введение в технику надежности и ремонтопригодности (второе изд.), Waveland Press, ISBN 978-1577666257
- ^ Мачин, Д., Чунг, Ю.Б., Пармар, М. (2006). Анализ выживания: практический подход. Германия: Уайли. Страница 36 и последующие Google Книги
- ^ Олкин, Ингрэм; Глесер, Леон; Дерман, Сайрус (1994), Вероятностные модели и приложения (второе изд.), Macmillan, ISBN 0-02-389220-Х
- ^ Кляйн, Джон; Моешбергер, Мелвин (2005), Анализ выживания: методы обработки цензурированных и усеченных данных (второе изд.), Springer, ISBN 978-0387953991
- ^ Менденхолл, Уильям; Терри, Синчич (2007), Статистика техники и наук (Пятое изд.), Пирсон / Прентис Холл, ISBN 978-0131877061
- ^ Бростром, Йоран (2012), Анализ истории событий с помощью R (первое издание), Chapman & Hall/CRC, ISBN 978-1439831649
- ^ Эфрон, Брэдли; Хасти, Тревор (2016), Статистический вывод компьютерного века: алгоритмы, доказательства и наука о данных (первое издание), Cambridge University Press, ISBN 978-1107149892
- ^ Лоулесс, Джеральд (2002), Статистические модели и методы анализа данных за весь срок службы (второе изд.), Wiley, ISBN 978-0471372158