Золотой стандарт (тест)
В медицине и медицинской статистике золотой стандарт , критериальный стандарт , [1] или эталонный стандарт [2] – это диагностический тест или эталонный тест , который является лучшим из доступных при разумных условиях. [3] Это тест, с которым сравниваются новые тесты, чтобы оценить их достоверность, и он используется для оценки эффективности лечения. [1]
Значения могут различаться между практической медициной и статистическим идеалом, потому что в медицине при некоторых заболеваниях только вскрытие гарантирует диагностическую достоверность, поэтому золотой стандартный тест будет лучшим тестом, позволяющим сохранить жизнь пациенту вместо аутопсии. В этих случаях даже так называемые тесты «золотого стандарта» требуют последующего наблюдения для подтверждения или опровержения диагноза. [4]
История
[ редактировать ]Термин «золотой стандарт» в его нынешнем понимании в медицинских исследованиях был введен Раддом в 1979 году в отношении денежного золотого стандарта. [5]
В медицине
[ редактировать ]«Золотой стандарт» может относиться к критериям, по которым оцениваются научные данные. Например, в исследованиях в области реанимации «золотым стандартом» лекарства или процедуры является то, приводит ли оно к увеличению числа неврологически неповрежденных выживших, выходящих из больницы. [6] Другие виды медицинских исследований могут рассматривать значительное снижение 30-дневной смертности как золотой стандарт. [ нужна ссылка ]
Руководство по стилю AMA отдает предпочтение стандарту фразовых критериев вместо «золотого стандарта». Другие журналы также предоставили мандаты в своих инструкциях для авторов. Например, в Архиве биологической медицины и реабилитации указано такое использование. [7] На практике, однако, понимание этого термина авторами, а также соблюдение его редакцией крайне плохое, по крайней мере, для журналов АМА. [8]
Когда критерием является вся процедура клинического тестирования, его обычно называют определением клинического случая . Различные определения случаев могут привести к совершенно разным результатам, если они используются в качестве основы для оценки конкретного диагностического метода. [9]
Гипотетический идеальный тест «золотого стандарта» имеет чувствительность 100% в отношении наличия заболевания (он выявляет всех лиц с четко выраженным болезненным процессом; он не дает ложноотрицательных результатов) и специфичность 100 % ( он не идентифицирует ложно человека с заболеванием, у которого нет этого заболевания; он не дает ложноположительных результатов); На практике не существует настоящих тестов «золотого стандарта». [10]
По мере появления новых методов диагностики «золотой стандарт» теста может со временем измениться. Например, для диагностики расслоения аорты золотым стандартом раньше была аортограмма , чувствительность которой составляла всего 83%, а специфичность - всего 87%. С развитием магнитно-резонансной томографии магнитно -резонансная ангиография (МРА) стала новым золотым стандартом диагностики расслоения аорты с чувствительностью 95% и специфичностью 92%. [ нужна ссылка ] До широкого принятия любого нового теста предыдущий тест сохраняет свой статус «золотого стандарта».
Тестовая калибровка
[ редактировать ]Поскольку тесты могут быть неправильными (давая ложноотрицательный или ложноположительный результат ), результаты следует интерпретировать в контексте анамнеза, физических данных и других результатов тестов испытуемого. Именно в этом контексте определяется чувствительность и специфичность теста «золотого стандарта». [ нужна ссылка ]
Если золотой стандарт не является совершенным, его чувствительность и специфичность должны быть откалиброваны по более точным тестам или по определению заболевания. [11] Эта калибровка особенно важна, когда идеальный тест доступен только при вскрытии. Тест должен соответствовать определенному соглашению между наблюдателями, чтобы избежать некоторой предвзятости, вызванной самим исследованием. [12]
Ошибки калибровки могут привести к ошибочному диагнозу . [13] [ сомнительно – обсудить ]
Двусмысленность
[ редактировать ]Иногда «золотой стандартный тест» относится к наиболее эффективному доступному тесту. В этих случаях не существует другого критерия, с которым его можно было бы сравнивать, и он эквивалентен определению. Говоря об этом значении, тесты золотого стандарта обычно не проводятся вообще. Это связано с тем, что тест «золотого стандарта» может быть трудно или невозможно провести на живом человеке (т. е. тест проводится в рамках вскрытия или может потребоваться слишком много времени, чтобы результаты теста стали доступны для клинического применения). полезный).
В других случаях «золотой стандарт» относится не к самому эффективному из доступных тестов, а к лучшему из доступных при разумных условиях. Например, в этом смысле МРТ является золотым стандартом диагностики опухолей головного мозга, хотя она и не так эффективна, как биопсия. В этом случае чувствительность и специфичность золотого стандарта не составляют 100%, и его называют «несовершенным золотым стандартом» или «сплавным золотым стандартом». [11]
Термин «основная истина» относится к лежащему в основе абсолютному состоянию информации; золотой стандарт стремится как можно точнее отразить основную истину. Хотя золотой стандарт — это лучший способ получить истину, основная истина обычно собирается путем прямых наблюдений. В машинном обучении и поиске информации предпочтительным термином является «основная истина», даже если классификации могут быть несовершенными; золотой стандарт считается основной истиной. [ нужна ссылка ]
Некоторые авторы используют термин «золотой стандарт». Клаассен утверждает, что такое использование неверно, поскольку «золотой стандарт» подразумевает уровень совершенства, недостижимый в медицинской науке. [5]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Перейти обратно: а б Боровиц Д., Аронофф Н., Каммингс Л.К., Макбул А., Мулберг А.Е. (апрель 2022 г.). «Коэффициент абсорбции жира для измерения эффективности заместительной терапии ферментами поджелудочной железы у людей с муковисцидозом: золотой стандарт или угольный стандарт?» . Поджелудочная железа . 51 (4): 310–318. дои : 10.1097/MPA.0000000000002016 . ПМЦ 9257055 . ПМИД 35695742 .
- ^ Золото, Р; Райхман, М; Гринберг, Э; Иванидзе Дж.; Элиас, Э; Циурис, AJ; Комунале, Япония; Джонсон, CE; Санелли, ПК (сентябрь 2010 г.). «Разработка нового эталонного стандарта: необходима ли валидация?» . Академическая радиология . 17 (9): 1079–82. дои : 10.1016/j.acra.2010.05.021 . ПМЦ 2919497 . ПМИД 20692619 .
- ^ Версия E (июль 1992 г.). « Золотой стандарт» — подходящий термин» . БМЖ . 305 (6846): 187. doi : 10.1136/bmj.305.6846.187-b . ПМЦ 1883235 . ПМИД 1515860 .
- ^ Фарди, Джон М.; Барретт, Брендан Дж. (2015). «Оценка диагностических тестов». Клиническая эпидемиология (PDF) . Методы молекулярной биологии. Том. 1281. С. 289–300. дои : 10.1007/978-1-4939-2428-8_17 . ISBN 978-1-4939-2427-1 . ПМИД 25694317 .
- ^ Перейти обратно: а б Клаассен, Дж. А. (24 декабря 2005 г.). «['Золотой стандарт', а не 'золотой стандарт']». Голландский медицинский журнал . 149 (52): 2937. ПМИД 16402524 .
- ^ ACLS: Принципы и практика . п. 62. Даллас: Американская кардиологическая ассоциация, 2003. ISBN 0-87493-341-2 .
- ^ «Руководство для авторов» . Архив биологической медицины и реабилитации . Эльзевир .
- ^ «Стандарт критериев — инсайдер стиля AMA» . 21 июня 2011 года . Проверено 18 мая 2021 г.
- ^ Бахманн, Лукас М; Юни, Питер; Райхенбах, Стефан; Зисвилер, Ганс-Рудольф; Кессельс, Альфонс Дж; Фёгелин, Эстер (1 августа 2005 г.). «Последствия различных диагностических «золотых стандартов» в исследовании точности тестов: на примере туннельного синдрома запястья» . Международный журнал эпидемиологии . 34 (4): 953–955. дои : 10.1093/ije/dyi105 . ПМИД 15911545 .
- ^ Трой Л.М., Михелс К.Б., Хантер Д.Д., Шпигельман Д., Мэнсон Дж.Е., Кольдиц Г.А. и др. (февраль 1996 г.). «Самооценка веса при рождении и история грудного вскармливания среди молодых женщин: оценка достоверности» . Международный журнал эпидемиологии . 25 (1): 122–127. дои : 10.1093/ije/25.1.122 . PMID 8666479 .
- ^ Перейти обратно: а б Шпигельман Д., Шнеевайс С., МакДермотт А. (январь 1997 г.). «Коррекция ошибок измерений для моделей логистической регрессии с «сплавным золотым стандартом» » . Американский журнал эпидемиологии . 145 (2): 184–196. doi : 10.1093/oxfordjournals.aje.a009089 . ПМИД 9006315 .
- ^ Штейн П.Д., Атанасулис С., Алави А., Гринспен Р.Х., Хейлз К.А., Зальцман Х.А. и др. (февраль 1992 г.). «Осложнения и достоверность легочной ангиографии при острой легочной эмболии» . Тираж . 85 (2): 462–468. дои : 10.1161/01.CIR.85.2.462 . ПМИД 1735144 .
- ^ Галлахер, член парламента, Мобли Л.Р., Клее Г.Г., Шривер П. (апрель 2004 г.). Влияние ошибки калибровки на принятие медицинских решений (PDF) (Отчет). Вашингтон (округ Колумбия): Национальный институт стандартов и технологий.