Количественная связь структура-активность
Количественные модели взаимосвязи структура-активность ( модели QSAR ) представляют собой модели регрессии или классификации, используемые в химических и биологических науках и технике. Как и другие модели регрессии, модели регрессии QSAR связывают набор переменных-предсказателей (X) с эффективностью переменной ответа (Y), тогда как модели классификации QSAR связывают переменные-предикторы с категориальным значением переменной ответа.
В моделировании QSAR предикторы состоят из физико-химических свойств или теоретических молекулярных дескрипторов. [1] [2] химикатов; Переменная ответа QSAR может быть биологической активностью химических веществ. Модели QSAR сначала суммируют предполагаемую взаимосвязь между химическими структурами и биологической активностью в наборе данных о химических веществах. Во-вторых, модели QSAR предсказывают активность новых химических веществ. [3] [4]
Связанные термины включают количественные отношения структура-свойство ( QSPR ), когда химическое свойство моделируется как переменная отклика. [5] [6] «Различные свойства или поведение химических молекул были исследованы в области QSPR. Некоторыми примерами являются количественные отношения структура-реактивность (QSRR), количественные отношения структура-хроматография (QSCR) и количественные отношения структура-токсичность (QSTR), количественная структура. – электрохимические отношения (QSER) и количественные структуры – биоразлагаемости (QSBR)». отношения [7]
Например, биологическая активность может быть выражена количественно как концентрация вещества, необходимая для возникновения определенного биологического ответа. Кроме того, когда физико-химические свойства или структуры выражаются числами, между ними можно обнаружить математическую связь или количественную связь структура-активность. Математическое выражение, если его тщательно проверить, [8] [9] [10] [11] затем можно использовать для прогнозирования смоделированной реакции других химических структур. [12]
QSAR имеет форму математической модели :
- Активность = f (физико-химические свойства и/или структурные свойства) + ошибка
Ошибка включает в себя ошибку модели ( смещение ) и изменчивость наблюдений, то есть изменчивость наблюдений даже на правильной модели.
Основные шаги в исследованиях QSAR
[ редактировать ]Основные этапы QSAR/QSPR включают в себя: [7]
- Выбор набора данных и извлечение структурных/эмпирических дескрипторов
- Выбор переменной
- Конструкция модели
- Оценка валидации
SAR и парадокс SAR
[ редактировать ]Основное предположение для всех гипотез, основанных на молекулах , заключается в том, что подобные молекулы обладают одинаковой активностью. Этот принцип также называется взаимосвязью структура-деятельность ( SAR ). Поэтому основная проблема заключается в том, как определить небольшое различие на молекулярном уровне, поскольку каждый вид активности, например реакционная способность, способность к биотрансформации , растворимость , целевая активность и т. д., может зависеть от другого различия. Примеры были приведены в обзорах биоизостеризма Патани / ЛаВойе. [13] и Браун. [14]
В общем, человека больше интересует обнаружение сильных тенденций . Создаваемые гипотезы обычно основаны на конечном числе химических веществ, поэтому необходимо проявлять осторожность, чтобы избежать переобучения : генерации гипотез, которые очень точно соответствуют обучающим данным, но плохо работают при применении к новым данным.
Парадокс SAR относится к тому факту, что не все подобные молекулы обладают одинаковой активностью. [ нужна ссылка ] .
Типы
[ редактировать ]На основе фрагментов (вклад группы)
[ редактировать ]Аналогично, « коэффициент распределения » — показатель дифференциальной растворимости, который сам по себе является компонентом предсказания QSAR — может быть предсказан либо атомарными методами (известными как «XLogP» или «ALogP»), либо методами химических фрагментов (известными как «CLogP»). и другие варианты). Показано, что logP соединения можно определить по сумме его фрагментов; Методы на основе фрагментов обычно считаются лучшими предикторами, чем методы на основе атомов. [15] Фрагментарные значения были определены статистически на основе эмпирических данных для известных значений logP. Этот метод дает неоднозначные результаты, и, как правило, его точность не превышает ±0,1 единицы. [16]
QSAR на основе группы или фрагмента также известен как GQSAR. [17] GQSAR позволяет гибко изучать различные представляющие интерес молекулярные фрагменты в зависимости от вариаций биологического ответа. Молекулярные фрагменты могут быть заместителями в различных сайтах замещения в родственном наборе молекул или могут быть основаны на заранее определенных химических правилах в случае неродственных наборов. GQSAR также учитывает перекрестные дескрипторы фрагментов, которые могут быть полезны при идентификации ключевых взаимодействий фрагментов при определении вариации активности. [17] Открытие свинца с использованием фрагномики — новая парадигма. В этом контексте FB-QSAR оказывается многообещающей стратегией для проектирования библиотек фрагментов и идентификации фрагментов. [18]
Разработан усовершенствованный подход к QSAR на основе фрагментов или групп, основанный на концепции фармакофорного сходства. [19] Этот метод, QSAR на основе фармакофорного сходства (PS-QSAR), использует топологические фармакофорные дескрипторы для разработки моделей QSAR. Такое предсказание активности может способствовать вкладу определенных характеристик фармакофора, кодируемых соответствующими фрагментами, в улучшение активности и/или вредные эффекты. [19]
3D-QSAR
[ редактировать ]Аббревиатура 3D-QSAR или 3-D QSAR относится к применению расчетов силового поля , требующих трехмерных структур заданного набора небольших молекул с известной активностью (обучающий набор). На обучающий набор необходимо наложить (выровнять) либо экспериментальные данные (например, на основе кристаллографии молекул лиганд-белок), либо программное обеспечение для наложения . Он использует вычисленные потенциалы, например, потенциал Леннарда-Джонса , а не экспериментальные константы, и касается всей молекулы, а не отдельного заместителя. Первый 3-D QSAR был назван Cramer et al. Сравнительным молекулярно-полевым анализом (CoMFA). Он исследовал стерические поля (форму молекулы) и электростатические поля. [20] которые были коррелированы с помощью частичной регрессии наименьших квадратов (PLS).
Созданное пространство данных затем обычно уменьшается путем последующего извлечения признаков (см. также уменьшение размерности ). Следующий метод обучения может быть любым из уже упомянутых методов машинного обучения , например, машины опорных векторов . [21] Альтернативный подход использует множественное обучение путем кодирования молекул как наборов экземпляров данных, каждый из которых представляет возможную молекулярную конформацию. Метка или ответ присваивается каждому набору, соответствующему активности молекулы, которая, как предполагается, определяется по меньшей мере одним экземпляром в наборе (т.е. некоторой конформацией молекулы). [22]
18 июня 2011 года патент на сравнительный молекулярно-полевой анализ (CoMFA) снял любые ограничения на использование технологий GRID и частичного метода наименьших квадратов (PLS). [ нужна ссылка ]
На основе химического дескриптора
[ редактировать ]В этом подходе дескрипторы, количественно определяющие различные электронные, геометрические или стерические свойства молекулы, вычисляются и используются для разработки QSAR. [23] Этот подход отличается от подхода фрагментов (или группового вклада) тем, что дескрипторы вычисляются для системы в целом, а не на основе свойств отдельных фрагментов. Этот подход отличается от подхода 3D-QSAR тем, что дескрипторы вычисляются на основе скалярных величин (например, энергии, геометрических параметров), а не на основе трехмерных полей.
Примером такого подхода являются QSAR, разработанные для полимеризации олефинов полусэндвичевыми соединениями . [24] [25]
Строковая основа
[ редактировать ]Было показано, что прогнозирование активности возможно даже на основе строки SMILES . [26] [27] [28]
На основе графа
[ редактировать ]Подобно струнным методам, молекулярный граф можно напрямую использовать в качестве входных данных для моделей QSAR. [29] [30] но обычно дают меньшую производительность по сравнению с моделями QSAR на основе дескрипторов. [31] [32]
Моделирование
[ редактировать ]В литературе часто можно встретить, что химики отдают предпочтение методам частичных наименьших квадратов (PLS). [ нужна ссылка ] поскольку он применяет извлечение и индукцию признаков за один шаг.
Подход к интеллектуальному анализу данных
[ редактировать ]Компьютерные модели SAR обычно рассчитывают относительно большое количество функций. Поскольку им не хватает возможности структурной интерпретации, этапы предварительной обработки сталкиваются с проблемой выбора признаков (т. е. какие структурные признаки следует интерпретировать для определения взаимосвязи структура-активность). Выбор признаков может осуществляться визуальным осмотром (качественный выбор человеком); путем интеллектуального анализа данных; или путем добычи молекул.
Типичное прогнозирование на основе интеллектуального анализа данных использует, например, машины опорных векторов , деревья решений , искусственные нейронные сети для создания модели прогнозного обучения.
Подходы молекулярного анализа , частный случай подходов структурированного анализа данных , применяют прогнозирование на основе матрицы сходства или схему автоматической фрагментации на молекулярные субструктуры. Кроме того, существуют также подходы, использующие поиск максимального общего подграфа или ядра графа . [33] [34]
Анализ подобранных молекулярных пар
[ редактировать ]Обычно модели QSAR, полученные с помощью нелинейного машинного обучения, рассматриваются как «черный ящик», которым не могут руководствоваться химики-медики. Недавно появилась относительно новая концепция анализа подобранных молекулярных пар. [35] или MMPA, основанный на прогнозировании, который сочетается с моделью QSAR для выявления перепадов активности. [36]
Оценка качества QSAR-моделей
[ редактировать ]Моделирование QSAR создает прогностические модели, полученные на основе применения статистических инструментов, сопоставляющих биологическую активность (включая желаемый терапевтический эффект и нежелательные побочные эффекты) или физико-химические свойства в моделях QSPR химических веществ (лекарственных средств/токсикантов/загрязнителей окружающей среды) с дескрипторами, репрезентативными для молекулярной структуры или свойств. . QSAR применяются во многих дисциплинах, например: оценка рисков , прогнозирование токсичности и принятие нормативных решений. [37] в дополнение к открытию лекарств и оптимизации потенциальных клиентов . [38] Получение модели QSAR хорошего качества зависит от многих факторов, таких как качество входных данных, выбор дескрипторов и статистических методов для моделирования и проверки. Любое моделирование QSAR должно в конечном итоге привести к созданию статистически надежных и прогнозирующих моделей, способных делать точные и надежные прогнозы смоделированного ответа новых соединений.
Для проверки моделей QSAR обычно применяются различные стратегии: [39]
- внутренняя проверка или перекрестная проверка (на самом деле, при извлечении данных перекрестная проверка является мерой надежности модели: чем более надежна модель (выше q2), тем меньше извлечение данных влияет на исходную модель);
- внешняя проверка путем разделения доступного набора данных на обучающий набор для разработки модели и набор прогнозов для проверки прогнозируемости модели;
- слепая внешняя проверка путем применения модели к новым внешним данным и
- рандомизация данных или Y-скремблирование для проверки отсутствия случайной корреляции между ответом и дескрипторами моделирования.
Успех любой модели QSAR зависит от точности входных данных, выбора подходящих дескрипторов и статистических инструментов и, что наиболее важно, проверки разработанной модели. Валидация — это процесс, посредством которого устанавливается надежность и актуальность процедуры для конкретной цели; для моделей QSAR проверка должна касаться главным образом надежности, прогнозируемых характеристик и области применимости (AD) моделей. [8] [9] [11] [40] [41]
Некоторые методологии проверки могут быть проблематичными. Например, перекрестная проверка с исключением одного исключения обычно приводит к переоценке прогностической способности. Даже при внешней проверке трудно определить, манипулировали ли выбором обучающих и тестовых наборов для максимизации прогностической способности публикуемой модели.
Различные аспекты проверки моделей QSAR, требующие внимания, включают методы выбора соединений обучающего набора, [42] установка размера обучающего набора [43] и влияние выбора переменных [44] для моделей обучающего набора для определения качества прогнозирования. Также важна разработка новых параметров проверки для оценки качества моделей QSAR. [11] [45] [46]
Приложение
[ редактировать ]Химическая
[ редактировать ]Одним из первых исторических применений QSAR было предсказание точек кипения . [47]
Хорошо известно, например, что внутри определенного семейства , химических соединений особенно органической химии , существуют сильные корреляции между структурой и наблюдаемыми свойствами. Простой пример — зависимость между количеством атомов углерода в алканах и температурой их кипения . Существует четкая тенденция повышения температуры кипения с увеличением числа атомов углерода, и это служит средством прогнозирования температур кипения высших алканов .
Еще очень интересное применение — уравнение Гаммета , уравнение Тафта и методы прогнозирования pKa . [48]
Биологический
[ редактировать ]Биологическую активность молекул обычно измеряют с помощью анализов, позволяющих установить уровень ингибирования определенных путей передачи сигнала или метаболических путей . Открытие лекарств часто предполагает использование QSAR для идентификации химических структур, которые могут оказывать хорошее ингибирующее действие на определенные мишени и иметь низкую токсичность (неспецифическую активность). Особый интерес представляет прогноз коэффициента распределения log P , который является важным показателем, используемым при определении « лекарственного сходства » в соответствии с «Правилом пяти» Липински . [ нужна ссылка ]
Хотя многие количественные анализы взаимосвязей структура-активность включают взаимодействия семейства молекул с сайтом связывания фермента или рецептора , QSAR также можно использовать для изучения взаимодействий между структурными доменами белков. Белко-белковые взаимодействия можно количественно проанализировать на предмет структурных изменений, возникающих в результате сайт-направленного мутагенеза . [49]
Это часть метода машинного обучения , позволяющая снизить риск парадокса SAR, особенно с учетом того, что доступен только конечный объем данных (см. также MVUE ). В целом все проблемы QSAR можно разделить на кодирование [50] и обучение . [51]
Приложения
[ редактировать ](Q)Модели SAR использовались для управления рисками . QSARS рекомендуются регулирующими органами; в Европейском Союзе QSAR предложены регламентом REACH , где «REACH» сокращенно означает «Регистрация, оценка, авторизация и ограничение химических веществ». Нормативное применение методов QSAR включает in silico . токсикологическую оценку генотоксичных примесей [52] Обычно используемое программное обеспечение для оценки QSAR, такое как DEREK или CASE Ultra (MultiCASE), используется для определения генотоксичности примесей в соответствии с ICH M7. [53]
Пространство химических дескрипторов, выпуклая оболочка которого создается конкретным обучающим набором химических веществ, называется областью применимости обучающего набора . Прогнозирование свойств новых химических веществ, находящихся за пределами области применимости, использует экстраполяцию и поэтому менее надежно (в среднем), чем прогнозирование внутри области применимости. Оценка надежности прогнозов QSAR остается темой исследования. [ нужна ссылка ]
Уравнения QSAR можно использовать для прогнозирования биологической активности новых молекул перед их синтезом.
Примеры инструментов машинного обучения для моделирования QSAR включают: [54]
S.No. | Имя | Алгоритмы | Внешняя ссылка |
---|---|---|---|
1. | Р | РФ, SVM, наивный байесовский подход и ИНС | «R: Проект R для статистических вычислений» . |
2. | libSVM | СВМ | «LIBSVM — библиотека для машин опорных векторов» . |
3. | Апельсин | RF, SVM и наивный байесовский метод | «Оранжевый интеллектуальный анализ данных» . |
4. | РапидМайнер | SVM, RF, наивный Байес, DT, ANN и k-NN | «RapidMiner | Платформа прогнозной аналитики с открытым исходным кодом №1» . |
5. | Положи это | RF, SVM и наивный Байес | «Weka 3 — интеллектуальный анализ данных с помощью программного обеспечения машинного обучения с открытым исходным кодом на Java» . Архивировано из оригинала 28 октября 2011 г. Проверено 24 марта 2016 г. |
6. | нож | DT, наивный Байес и SVM | «KNIME | Открыт для инноваций» . |
7. | AZОранжевый [55] | РТ, СВМ, ИНС и РФ | «AZCompTox/AZOrange: дополнения AstraZeneca к Orange» . Гитхаб . 19 сентября 2018 г. |
8. | Танагра | SVM, RF, наивный Байес и DT | «ТАНАГРА — бесплатное программное обеспечение для интеллектуального анализа данных для обучения и исследований» . Архивировано из оригинала 19 декабря 2017 г. Проверено 24 марта 2016 г. |
9. | Elki | к-НН | «Структура интеллектуального анализа данных ELKI» . Архивировано из оригинала 19 ноября 2016 г. |
10. | МОЛОТОК | "Домашняя страница МАЛЛЕТ" . | |
11. | МОА | «Массовый онлайн-анализ MOA | Аналитика потоков данных в реальном времени» . Архивировано из оригинала 19 июня 2017 г. | |
12. | Дип Хим | Логистическая регрессия, Наивный Байес, РФ, ИНС и другие. | «ДипХим» . deepchem.io . Проверено 20 октября 2017 г. |
13. | АльваМодель [56] | Регрессия ( OLS , PLS , k-NN , SVM и консенсус) и классификация ( LDA/QDA , PLS-DA , k-NN , SVM и консенсус) | «alvaModel: программный инструмент для создания моделей QSAR/QSPR» . alvascience.com . |
14. | scikit-learn ( Python ) [57] | Логистическая регрессия, Наивный Байес, kNN, RF, SVM, GP, ANN и другие. | «SciKit-Learn» . scikit-learn.org . Проверено 13 августа 2023 г. |
См. также
[ редактировать ]- АДМЕ
- Хеминформатика
- Компьютерный дизайн лекарств (CADD)
- Отношения конформация-деятельность
- Дифференциальная растворимость
- Анализ подобранных молекулярных пар
- Молекулярный дескриптор
- Программное обеспечение для молекулярного дизайна
- Коэффициент распределения
- Фармакокинетика
- Фармакофор
- Кью-ЯРОСТЬ
- QSAR и комбинаторная наука - Научный журнал
- Программное обеспечение для моделирования молекулярной механики
- Chemicalize.org : Список свойств на основе предсказанной структуры.
Ссылки
[ редактировать ]- ^ Тодескини, Роберто; Консонни, Вивиана (2009). Молекулярные дескрипторы для хемоинформатики . Методы и принципы медицинской химии. Том. 41. Уайли. дои : 10.1002/9783527628766 . ISBN 978-3-527-31852-0 .
- ^ Маури, Андреа; Консонни, Вивиана; Тодескини, Роберто (2017). «Молекулярные дескрипторы». Справочник по вычислительной химии . Международное издательство Спрингер. стр. 2065–2093. дои : 10.1007/978-3-319-27282-5_51 . ISBN 978-3-319-27282-5 .
- ^ Рой К., Кар С., Дас Р.Н. (2015). «Глава 1.2: Что такое QSAR? Определения и формулизм» . Учебное пособие по моделированию QSAR/QSPR: фундаментальные концепции . Нью-Йорк: Springer-Verlag Inc., стр. 2–6. ISBN 978-3-319-17281-1 .
- ^ Гасеми, Перес-Санчес; Мехри, Перес-Гарридо (2018). «Нейронные сети и алгоритмы глубокого обучения, используемые в исследованиях QSAR: достоинства и недостатки». Открытие наркотиков сегодня . 23 (10): 1784–1790. дои : 10.1016/j.drudis.2018.06.016 . ПМИД 29936244 . S2CID 49418479 .
- ^ Нантасенамат С, Исаранкура-На-Аюдхья С, Наэнна Т, Прачаяситтикул В (2009). «Практический обзор количественной связи структура-активность». Эксклюзивный журнал . 8 : 74–88. дои : 10.17877/DE290R-690 .
- ^ Нантасенамат С, Исаранкура-На-Аюдхья С, Прачаяситтикул V (июль 2010 г.). «Достижения в области вычислительных методов прогнозирования биологической активности соединений». Мнение экспертов об открытии лекарств . 5 (7): 633–54. дои : 10.1517/17460441.2010.492827 . ПМИД 22823204 . S2CID 17622541 .
- ^ Jump up to: а б Юсефинежад С., Хемматинежад Б. (2015). «Инструменты хемометрики в исследованиях QSAR/QSPR: историческая перспектива». Хемометрика и интеллектуальные лабораторные системы . 149, Часть Б: 177–204. дои : 10.1016/j.chemolab.2015.06.016 .
- ^ Jump up to: а б Тропша А , Граматика П, Гомбар В.Дж. (2003). «Как важно быть серьезным: проверка является абсолютно необходимой для успешного применения и интерпретации моделей QSPR». QSAR Гребень. Наука . 22 : 69–77. дои : 10.1002/qsar.200390007 .
- ^ Jump up to: а б Граматика П (2007). «Принципы валидации моделей QSAR: внутренняя и внешняя». QSAR Гребень. Наука . 26 (5): 694–701. дои : 10.1002/qsar.200610151 . hdl : 11383/1668881 .
- ^ Руусманн, В.; Силд, С.; Маран, У. (2015). «Репозиторий QSAR DataBank: открытые и связанные качественные и количественные модели взаимосвязи структура-активность» . Журнал хеминформатики . 7:32 . дои : 10.1186/s13321-015-0082-6 . ПМК 4479250 . ПМИД 26110025 .
- ^ Jump up to: а б с Кирико Н., Граматика П. (август 2012 г.). «Реальная внешняя прогнозируемость моделей QSAR. Часть 2. Новые сопоставимые пороговые значения для различных критериев проверки и необходимость проверки диаграммы рассеяния». Журнал химической информации и моделирования . 52 (8): 2044–58. дои : 10.1021/ci300084j . ПМИД 22721530 .
- ^ Тропша, Александр (2010). «Лучшие практики разработки, проверки и использования моделей QSAR». Молекулярная информатика . 29 (6–7): 476–488. дои : 10.1002/минф.201000061 . ISSN 1868-1743 . ПМИД 27463326 . S2CID 23564249 .
- ^ Патани Г.А., ЛаВуа Э.Дж. (декабрь 1996 г.). «Биоизостеризм: рациональный подход к разработке лекарств». Химические обзоры . 96 (8): 3147–3176. дои : 10.1021/cr950066q . ПМИД 11848856 .
- ^ Браун Н. (2012). Биоизостеры в медицинской химии . Вайнхайм: Wiley-VCH. ISBN 978-3-527-33015-7 .
- ^ Томпсон С.Дж., Хаттотувагама К.К., Холлидей Дж.Д., Флауэр Д.Р. (2006). «О гидрофобности пептидов: сравнение эмпирических предсказаний значений log P пептидов» . Биоинформация . 1 (7): 237–41. дои : 10.6026/97320630001237 . ЧВК 1891704 . ПМИД 17597897 .
- ^ Уайлдман С.А., Криппен ГМ (1999). «Прогнозирование физико-химических параметров по атомным вкладам». Дж. Хим. Инф. Вычислить. Наука . 39 (5): 868–873. дои : 10.1021/ci990307l .
- ^ Jump up to: а б Аджмани С., Джадхав К., Кулкарни С.А., QSAR на групповой основе (G-QSAR)
- ^ Манохаран П., Виджаян Р.С., Гошал Н. (октябрь 2010 г.). «Рационализация открытия лекарств на основе фрагментов для BACE1: результаты исследований FB-QSAR, FB-QSSR, многоцелевых (MO-QSPR) и MIF». Журнал компьютерного молекулярного дизайна . 24 (10): 843–64. Бибкод : 2010JCAMD..24..843M . дои : 10.1007/s10822-010-9378-9 . ПМИД 20740315 . S2CID 1171860 .
- ^ Jump up to: а б Прасант Кумар С., Джасрай Ю.Т., Пандья Х.А., Равал Р.М. (ноябрь 2013 г.). «QSAR на основе сходства фармакофоров (PS-QSAR) для прогнозирования биологической активности для конкретных групп» . Журнал биомолекулярной структуры и динамики . 33 (1): 56–69. дои : 10.1080/07391102.2013.849618 . ПМИД 24266725 . S2CID 45364247 .
- ^ Лич А.Р. (2001). Молекулярное моделирование: принципы и приложения . Энглвуд Клиффс, Нью-Джерси: Прентис Холл. ISBN 978-0-582-38210-7 .
- ^ Верт Дж.П., Шёлкопф Б., Цуда К. (2004). Ядерные методы в вычислительной биологии . Кембридж, Массачусетс: MIT Press. ISBN 978-0-262-19509-6 .
- ^ Дитерих Т.Г., Латроп Р.Х., Лозано-Перес Т. (1997). «Решение задачи множественных экземпляров с прямоугольниками, параллельными осям». Искусственный интеллект . 89 (1–2): 31–71. дои : 10.1016/S0004-3702(96)00034-3 .
- ^ Карутерс Дж.М., Лаутербах Дж.А., Томсон К.Т., Венкатасубраманиан В., Снайвли СМ, Бхан А., Катаре С., Оскарсдоттир Г. (2003). «Разработка катализатора: извлечение знаний из высокопроизводительных экспериментов». Дж. Катал . 216 (1–2): 3776–3777. дои : 10.1016/S0021-9517(02)00036-2 .
- ^ Манц Т.А., Фомфрай К., Медведев Г., Кришнамурти Б.Б., Шарма С., Хак Дж., Новструп К.А., Томсон К.Т., Делгасс В.Н., Карутерс Дж.М., Абу-Омар М.М. (апрель 2007 г.). «Корреляция структура-активность в титановых катализаторах полимеризации олефинов с одним центром, содержащих смешанное лигирование циклопентадиенил / арилоксид». Журнал Американского химического общества . 129 (13): 3776–7. дои : 10.1021/ja0640849 . ПМИД 17348648 .
- ^ Манц Т.А., Карутерс Дж.М., Шарма С., Фомфрай К., Томсон К.Т., Делгасс В.Н., Абу-Омар М.М. (2012). «Корреляция структура-активность относительного инициирования цепи и скорости ее распространения в катализе одноцентровой полимеризации олефинов». Металлоорганические соединения . 31 (2): 602–618. дои : 10.1021/om200884x .
- ^ Ястржембский, Станислав; Лесняк, Дамиан; Чарнецкий, Войцех Мариан (8 марта 2018 г.). «Учимся УЛЫБАТЬСЯ(И)». arXiv : 1602.06289 [ cs.CL ].
- ^ Бьеррум, Эсбен Янник (17 мая 2017 г.). «Перечисление SMILES как увеличение данных для нейросетевого моделирования молекул». arXiv : 1703.07076 [ cs.LG ].
- ^ Майр, Андреас; Кламбауэр, Гюнтер; Унтертинер, Томас; Стейярт, Марвин; Вегнер, Йорг К.; Сеулеманс, Хьюго; Клеверт, Джорк-Арне; Хохрайтер, Зепп (20 июня 2018 г.). «Крупномасштабное сравнение методов машинного обучения для прогнозирования мишени лекарств с помощью ChEMBL» . Химическая наука . 9 (24): 5441–5451. дои : 10.1039/c8sc00148k . ПМК 6011237 . ПМИД 30155234 .
- ^ Мерквирт, Кристиан; Ленгауэр, Томас (1 сентября 2005 г.). «Автоматическая генерация дополнительных дескрипторов с сетями молекулярных графов». Журнал химической информации и моделирования . 45 (5): 1159–1168. дои : 10.1021/ci049613b . ПМИД 16180893 .
- ^ Кирнс, Стивен; Макклоски, Кевин; Берндл, Марк; Панде, Виджай; Райли, Патрик (1 августа 2016 г.). «Свертки молекулярных графов: выход за рамки отпечатков пальцев» . Журнал компьютерного молекулярного дизайна . 30 (8): 595–608. arXiv : 1603.00856 . Бибкод : 2016JCAMD..30..595K . дои : 10.1007/s10822-016-9938-8 . ПМК 5028207 . ПМИД 27558503 .
- ^ Цзян, Дэджун; Ву, Чжэньсин; Се, Чан-Ю; Чен, Гуанъюн; Ляо, Бен; Ван, Чжэ; Шен, Чао; Цао, Дуншэн; Ву, Цзянь; Хоу, Тинцзюнь (17 февраля 2021 г.). «Могут ли графические нейронные сети лучше изучить молекулярное представление для открытия лекарств? Сравнительное исследование моделей на основе дескрипторов и моделей на основе графов» . Журнал хеминформатики . 13 (1): 12. дои : 10.1186/s13321-020-00479-8 . ПМЦ 7888189 . ПМИД 33597034 .
- ^ ван Тилборг, Дерек; Аленичева, Алиса; Гризони, Франческа (12 декабря 2022 г.). «Выявление ограничений молекулярного машинного обучения с помощью скачков активности» . Журнал химической информации и моделирования . 62 (23): 5938–5951. doi : 10.1021/acs.jcim.2c01073 . ПМЦ 9749029 . ПМИД 36456532 .
- ^ Гасфилд Д. (1997). Алгоритмы на строках, деревьях и последовательностях: информатика и вычислительная биология . Кембридж, Великобритания: Издательство Кембриджского университета. ISBN 978-0-521-58519-4 .
- ^ Хельма С (2005). Предиктивная токсикология . Вашингтон, округ Колумбия: Тейлор и Фрэнсис. ISBN 978-0-8247-2397-2 .
- ^ Доссеттер АГ, Гриффен Э.Дж., Лич АГ (2013). «Анализ согласованных молекулярных пар при открытии лекарств». Открытие наркотиков сегодня . 18 (15–16): 724–31. дои : 10.1016/j.drudis.2013.03.003 . ПМИД 23557664 .
- ^ Сушко Ю, Новотарский С, Кернер Р, Фогт Дж, Абдельазиз А, Тетко IV (2014). «Соответствующие молекулярные пары на основе прогнозов для интерпретации QSAR и помощи в процессе молекулярной оптимизации» . Журнал хеминформатики . 6 (1): 48. дои : 10.1186/s13321-014-0048-0 . ПМЦ 4272757 . ПМИД 25544551 .
- ^ Тонг В., Хун Х., Се Кью, Ши Л., Фанг Х., Перкинс Р. (апрель 2005 г.). «Оценка ограничений QSAR – нормативно-правовая перспектива» . Современный компьютерный дизайн лекарств . 1 (2): 195–205. дои : 10.2174/1573409053585663 .
- ^ Дирден Дж. К. (2003). «In silico прогнозирование токсичности лекарств». Журнал компьютерного молекулярного дизайна . 17 (2–4): 119–27. Бибкод : 2003JCAMD..17..119D . дои : 10.1023/А:1025361621494 . ПМИД 13677480 . S2CID 21518449 .
- ^ Уолд С., Эрикссон Л. (1995). «Статистическая проверка результатов QSAR». В Waterbeemd, Хан ван де (ред.). Хемометрические методы в молекулярном дизайне . Вайнхайм: ВЧ. стр. 309–318. ISBN 978-3-527-30044-0 .
- ^ Рой К. (декабрь 2007 г.). «О некоторых аспектах валидации прогнозных количественных моделей взаимосвязи структура-активность». Мнение экспертов об открытии лекарств . 2 (12): 1567–77. дои : 10.1517/17460441.2.12.1567 . ПМИД 23488901 . S2CID 21305783 .
- ^ Сахигара, Файзан; Мансури, Камель; Баллабио, Давиде; Маури, Андреа; Консонни, Вивиана; Тодескини, Роберто (2012). «Сравнение различных подходов к определению области применимости моделей QSAR» . Молекулы . 17 (5): 4791–4810. дои : 10.3390/molecules17054791 . ПМК 6268288 . ПМИД 22534664 .
- ^ Леонард Дж. Т., Рой К. (2006). «О выборе обучающих и тестовых наборов для разработки прогнозирующих QSAR-моделей». QSAR и комбинаторная наука . 25 (3): 235–251. дои : 10.1002/qsar.200510161 .
- ^ Рой П.П., Леонард Дж.Т., Рой К. (2008). «Изучение влияния размера обучающих наборов на разработку прогнозирующих моделей QSAR». Хемометрика и интеллектуальные лабораторные системы . 90 (1): 31–42. дои : 10.1016/j.chemolab.2007.07.004 .
- ^ Положите R, Вандер Хейден Y (октябрь 2007 г.). «Обзор аспектов моделирования количественных зависимостей сохранения структуры в обращенно-фазовой жидкостной хроматографии». Аналитика Химика Акта . 602 (2): 164–72. дои : 10.1016/j.aca.2007.09.014 . ПМИД 17933600 .
- ^ Пратим Рой П., Пол С., Митра И., Рой К. (2009). «О двух новых параметрах проверки прогнозирующих моделей QSAR» . Молекулы . 14 (5): 1660–701. дои : 10.3390/molecules14051660 . ПМК 6254296 . ПМИД 19471190 .
- ^ Кирико Н., Граматика П. (сентябрь 2011 г.). «Реальная внешняя прогнозируемость моделей QSAR: как ее оценить? Сравнение различных критериев проверки и предложение использования коэффициента корреляции согласия». Журнал химической информации и моделирования . 51 (9): 2320–35. дои : 10.1021/ci200211n . ПМИД 21800825 .
- ^ Рувре Д.Х., Бончев Д. (1991). Химическая теория графов: введение и основы . Танбридж Уэллс, Кент, Англия: Abacus Press. ISBN 978-0-85626-454-2 .
- ^ Фрачкевич, Р. (2013). «In Silico предсказание ионизации». В Ридейке, Дж. (ред.). Справочный модуль по химии, молекулярным наукам и химической инженерии . Справочный модуль по химии, молекулярным наукам и химической инженерии [онлайн] . Том. 5. Амстердам, Нидерланды: Эльзевир. дои : 10.1016/B978-0-12-409547-2.02610-X . ISBN 9780124095472 .
- ^ Фрейхульт Э.К., Андерссон К., Густафссон М.Г. (апрель 2003 г.). «Структурное моделирование расширяет QSAR-анализ взаимодействий антитело-лизоцим до 3D-QSAR» . Биофизический журнал . 84 (4): 2264–72. Бибкод : 2003BpJ....84.2264F . дои : 10.1016/S0006-3495(03)75032-2 . ПМК 1302793 . ПМИД 12668435 .
- ^ Тиммерман Х., Тодескини Р., Консонни В., Маннхольд Р., Кубиньи Х. (2002). Справочник молекулярных дескрипторов . Вайнхайм: Wiley-VCH. ISBN 978-3-527-29913-3 .
- ^ Дуда Р.О., Харт П.В., Сторк Д.Г. (2001). Классификация узоров . Чичестер: Джон Уайли и сыновья. ISBN 978-0-471-05669-0 .
- ^ Фиораванзо, Э.; Бассан, А.; Паван, М.; Мостраг-Шлихтынг, А.; Стоит, AP (01 апреля 2012 г.). «Роль инструментов генотоксичности in silico в нормативной оценке фармацевтических примесей». SAR и QSAR в экологических исследованиях . 23 (3–4): 257–277. дои : 10.1080/1062936X.2012.657236 . ISSN 1062-936X . ПМИД 22369620 . S2CID 2714861 .
- ^ ICH M7 Оценка и контроль примесей, реагирующих с ДНК (мутагенных) в фармацевтических препаратах, для ограничения потенциального канцерогенного риска - Научное руководство [1]
- ^ Лавечкья А (март 2015 г.). «Подходы машинного обучения к открытию лекарств: методы и приложения». Открытие наркотиков сегодня . 20 (3): 318–31. дои : 10.1016/j.drudis.2014.10.012 . ПМИД 25448759 .
- ^ Столринг Дж.К., Карлссон Л.А., Алмейда П., Бойер С. (2011). «AZOrange — Высокопроизводительное машинное обучение с открытым исходным кодом для моделирования QSAR в среде графического программирования» . Журнал хеминформатики . 3:28 . дои : 10.1186/1758-2946-3-28 . ПМК 3158423 . ПМИД 21798025 .
- ^ Маури, Андреа; Бертола, Маттео (2022). «Alvascience: новый пакет программного обеспечения для рабочего процесса QSAR, применяемого к проницаемости гематоэнцефалического барьера» . Международный журнал молекулярных наук . 23 (12882): 12882. дои : 10.3390/ijms232112882 . ПМЦ 9655980 . ПМИД 36361669 .
- ^ Фабиан Педрегоса; Гаэль Варокво; Александр Грамфор; Винсент Мишель; Бертран Тирион; Оливье Гризель; Матье Блондель; Питер Преттенхофер; Рон Вайс; Винсент Дюбур; Джейк Вандерплас; Александр Пассос; Дэвид Курнапо; Матье Перро; Эдуард Дюшенэ (2011). «scikit-learn: машинное обучение на Python» . Журнал исследований машинного обучения . 12 : 28:25–28:30.
Дальнейшее чтение
[ редактировать ]- Компакт-диск Селассие (2003). «История количественных связей структура-активность» (PDF) . В Аврааме DJ (ред.). Лекарственная химия Бургера и открытие лекарств . Том. 1 (6-е изд.). Нью-Йорк: Уайли. стр. 1–48. ISBN 978-0-471-27401-8 .
- Шитяков С., Пушкаш И., Рёвер Н., Фёрстер С., Брошейт Дж. (2014). «Трехмерная количественная связь структура-активность и исследования докинга в ряде производных антоцианов в качестве ингибиторов цитохрома P450 3A4» . Достижения и приложения в биоинформатике и химии . 7 : 11–21. дои : 10.2147/AABC.S56478 . ПМК 3970920 . ПМИД 24741320 .
Внешние ссылки
[ редактировать ]- «Общество хеминформатики и QSAR» . Проверено 11 мая 2009 г.
- «3D QSAR-сервер» . Проверено 18 июня 2011 г.
- Верма, Раджешвар П.; Ханш, Корвин (2007). «Протоколы природы: разработка моделей QSAR с использованием программы C-QSAR» . Протокол обмена . дои : 10.1038/nprot.2007.125 . Архивировано из оригинала 1 мая 2007 г. Проверено 11 мая 2009 г.
Программа регрессии, имеющая две базы данных с более чем 21 000 моделями QSAR.
- «Мир QSAR» . Архивировано из оригинала 25 апреля 2009 г. Проверено 11 мая 2009 г.
Комплексный веб-ресурс для разработчиков моделей QSAR.
- Инструменты хемоинформатики. Архивировано 4 июля 2017 г. в Wayback Machine , Лаборатории теории лекарств и хеминформатики.
- Цифры многомасштабной концептуальной модели QSAR в биологии и науке об окружающей среде