R-фактор (кристаллография)
В кристаллографии R -фактор (иногда называемый остаточным фактором или фактором надежности или R-значением или R Work ) является мерой согласия между кристаллографической моделью и экспериментальными данными дифракции рентгеновских лучей . Другими словами, это мера того, насколько хорошо уточненная структура предсказывает наблюдаемые данные. [ 1 ] Значение также иногда называют индексом несоответствия , поскольку оно математически описывает разницу между экспериментальными наблюдениями и идеальными расчетными значениями. [ 2 ] Он определяется следующим уравнением:
где F - так называемый структурный фактор , и сумма распространяется на все отражения измеренных рентгеновских лучей и их рассчитанных аналогов соответственно. Структурный фактор тесно связан с интенсивностью описываемого им отражения:
- .
Минимально возможное значение равно нулю, что указывает на идеальное согласие между экспериментальными наблюдениями и структурными факторами, предсказанными моделью. Теоретического максимума не существует, но на практике значения значительно меньше единицы даже для плохих моделей, при условии, что модель включает подходящий масштабный коэффициент. Случайные экспериментальные ошибки в данных способствуют даже для идеальной модели, и они имеют больше преимуществ, когда данных мало или мало, например, для набора данных с низким разрешением. Неадекватность модели, такая как неправильные или отсутствующие части и немоделированный беспорядок, являются другими основными причинами ошибок. , что делает его полезным для оценки хода и конечного результата уточнения кристаллографической модели. Для больших молекул R-фактор обычно находится в диапазоне от 0,6 (при расчете для случайной модели и на основе набора экспериментальных данных) до 0,2 (например, для хорошо уточненной макромолекулярной модели с разрешением 2,5 ангстрем). Маленькие молекулы (около 1000 атомов) обычно образуют более упорядоченные кристаллы, чем большие молекулы, и, таким образом, можно достичь более низких R-факторов. В Кембриджской структурной базе данных низкомолекулярных структур более 95% из более чем 500 000 кристаллов имеют R-фактор ниже 0,15, а 9,5% имеют R-фактор ниже 0,03.
Кристаллографы также используют свободный R-фактор ( ) [ 3 ] для оценки возможного перемоделирования данных. рассчитывается по той же формуле, приведенной выше, но на небольшой случайной выборке данных, которые отложены для этой цели и никогда не включаются в уточнение. всегда будет больше, чем потому что модель не приспособлена к отражениям, которые способствуют , но эти две статистики должны быть похожими, поскольку правильная модель должна предсказывать все данные с одинаковой точностью. Если две статистики значительно различаются, это указывает на то, что модель была чрезмерно параметризована, так что в некоторой степени она предсказывает не идеальные безошибочные данные для правильной модели, а скорее фактически наблюдаемые данные с ошибками.
Количества и аналогичным образом используются для описания внутреннего согласия измерений в наборе кристаллографических данных.
Ссылки
[ редактировать ]- ^ Моррис А.Л., Макартур М.В., Хатчинсон Э.Г., Торнтон Дж.М. (апрель 1992 г.). «Стереохимическое качество координат белковой структуры». Белки . 12 (4): 345–64. дои : 10.1002/прот.340120407 . ПМИД 1579569 .
- ^ «Р-фактор» . Международный союз кристаллографии . Проверено 13 декабря 2013 г.
- ^ Брунгер А.Т. (январь 1992 г.). «Свободное значение R: новая статистическая величина для оценки точности кристаллических структур». Природа . 355 (6359): 472–475. Бибкод : 1992Natur.355..472B . дои : 10.1038/355472a0 . ПМИД 18481394 .