Молекулярный дескриптор
Молекулярные дескрипторы играют фундаментальную роль в химии, фармацевтике, политике защиты окружающей среды и исследованиях в области здравоохранения, а также в контроле качества, поскольку молекулы, считающиеся реальными телами, преобразуются в числа, что позволяет осуществлять некоторую математическую обработку химических веществ. информация, содержащаяся в молекуле. Тодескини и Консонни определили это как:
« Молекулярный дескриптор — это конечный результат логической и математической процедуры, которая преобразует химическую информацию, закодированную в символическом представлении молекулы, в полезное число или результат некоторого стандартизированного эксперимента » . [1]
По этому определению молекулярные дескрипторы делятся на две основные категории: экспериментальные измерения , такие как log P , молярная рефракция , дипольный момент , поляризуемость и, в целом, аддитивные физико-химические свойства, и теоретические молекулярные дескрипторы , которые выводятся из символическое представление молекулы и может быть дополнительно классифицировано в соответствии с различными типами молекулярного представления. [2]
Основными классами теоретических молекулярных дескрипторов являются: 1) 0D-дескрипторы (т.е. конституционные дескрипторы, графовые дескрипторы), 2) 1D-дескрипторы (т.е. список структурных фрагментов, отпечатки пальцев),3) 2D-дескрипторы (т.е. графовые инварианты),4 ) 3D-дескрипторы (такие, как, например, дескрипторы 3D-MoRSE, дескрипторы WHIM, дескрипторы GETAWAY, квантово-химические дескрипторы, дескрипторы размера, стерических, поверхностных и объемных дескрипторов),5) 4D-дескрипторы (например, полученные из GRID или методы CoMFA, Volsurf). Распространение искусственного интеллекта и машинного обучения в вычислительной химии также привело к различным попыткам открыть новые дескрипторы или найти наиболее прогнозирующие среди тех или иных кандидатов. [3] [4]
дескрипторов инвариантности Свойства молекулярных
Свойства инвариантности молекулярных дескрипторов можно определить как способность алгоритма их расчета давать значение дескриптора, независимое от конкретных характеристик молекулярного представления, таких как нумерация или маркировка атомов, пространственная система отсчета, молекулярные конформации и т. д. Инвариантность к молекулярной нумерации или маркировке считается минимальным базовым требованием для любого дескриптора. [ нужна ссылка ]
Два других важных свойства инвариантности, трансляционная инвариантность и вращательная инвариантность , представляют собой инвариантность значения дескриптора к любому перемещению или вращению молекул в выбранной системе отсчета. Эти последние свойства инвариантности необходимы для 3D-дескрипторов. [ нужна ссылка ]
Вырождение молекулярных дескрипторов [ править ]
Это свойство относится к способности дескриптора избегать равных значений для разных молекул.В этом смысле дескрипторы могут вообще не проявлять вырождения, иметь низкую, среднюю или высокую вырожденность.Например, количество атомов молекул и молекулярные массы являются дескрипторами высокой вырожденности, в то время как 3D-дескрипторы обычно демонстрируют низкую вырожденность или вообще ее отсутствие. [ нужна ссылка ]
Основные требования к оптимальным дескрипторам [ править ]
- Должна иметь структурную интерпретацию
- Должна иметь хорошую корреляцию хотя бы с одним свойством.
- Предпочтительно проводить различие между изомерами
- Должно быть возможно применить к местной структуре
- Должна быть возможность обобщения на «более высокие» дескрипторы.
- Должно быть просто
- Не должно основываться на экспериментальных свойствах
- Не должно быть тривиально связано с другими дескрипторами.
- Должна быть возможность эффективно построить
- Следует использовать знакомые структурные концепции.
- Должны меняться постепенно с постепенными изменениями в структурах
- Должна иметь правильную зависимость от размера, если она связана с размером молекулы.
Программное обеспечение для расчета молекулярных дескрипторов [ править ]
Здесь приведен список коммерческих и бесплатных инструментов расчета дескрипторов.
Имя | Дескрипторы | Отпечатки пальцев | интерфейс командной строки | графический интерфейс | НИМЭ | Комментарии | Лицензия | Веб-сайт |
---|---|---|---|---|---|---|---|---|
альвадеск [5] [6] | 5666 | Да | Да | Да | Да | Доступно для Windows, Linux и macOS | Собственный , коммерческий | https://www.alvascience.com/alvadesc/ |
Дракон [7] | 5270 | Да | Да | Да | Да | Снято с производства | Собственный , коммерческий | https://chm.kode-solutions.net/products_dragon.php |
Мордред [8] | 1826 | Нет | Да | Нет | Нет | На основе RDKit | Бесплатный открытый исходный код | https://github.com/mordred-descriptor |
PaDEL-дескриптор [9] | 1875 | Да | Да | Да | Да | На основе СДК | Бесплатный открытый исходный код | http://www.yapcwsoft.com/dd/padeldescriptor/ |
См. также [ править ]
- Математическая химия
- Топологический индекс
- КСАР
- Область применения
- Химическая база данных
- Док (молекулярный)
- Правило приоритета Кана-Ингольда-Прелога
Ссылки [ править ]
- ^ Тодескини, Роберто; Консонни, Вивиана (2000). Справочник молекулярных дескрипторов . Методы и принципы медицинской химии. Уайли. дои : 10.1002/9783527613106 . ISBN 978-3-527-29913-3 .
- ^ Маури, Андреа; Консонни, Вивиана; Тодескини, Роберто (2017). «Молекулярные дескрипторы». Справочник по вычислительной химии . Международное издательство Спрингер. стр. 2065–2093. дои : 10.1007/978-3-319-27282-5_51 . ISBN 978-3-319-27282-5 .
- ^ Мюллер, Тим; Кусне, Аарон Гилад; Рампрасад, Рампи (01 апреля 2016 г.). «Машинное обучение в материаловедении». В Паррилле, Эбби Л.; Липковиц, Кенни Б. (ред.). Обзоры по вычислительной химии . Том. 29 (1-е изд.). Уайли. стр. 186–273. дои : 10.1002/9781119148739.ch4 . ISBN 978-1-119-10393-6 .
- ^ Гирингелли, Лука М.; Выбирал, Ян; Левченко Сергей Владимирович; Драксл, Клаудия; Шеффлер, Матиас (10 марта 2015 г.). «Большие данные материаловедения: критическая роль дескриптора». Письма о физических отзывах . 114 (10). 105503. arXiv : 1411.7437 . Бибкод : 2015PhRvL.114j5503G . doi : 10.1103/PhysRevLett.114.105503 . ПМИД 25815947 .
- ^ Маури, Андреа (2020). «alvaDesc: инструмент для расчета и анализа молекулярных дескрипторов и отпечатков пальцев». Методы фармакологии и токсикологии . Нью-Йорк, штат Нью-Йорк: Springer US. стр. 801–820. дои : 10.1007/978-1-0716-0150-1_32 . ISBN 978-1-0716-0149-5 . ISSN 1557-2153 . S2CID 213896490 .
- ^ Маури, Андреа; Бертола, Маттео (2022). «Alvascience: новый пакет программного обеспечения для рабочего процесса QSAR, применяемого к проницаемости гематоэнцефалического барьера» . Международный журнал молекулярных наук . 23 (12882): 12882. дои : 10.3390/ijms232112882 . ПМЦ 9655980 . ПМИД 36361669 .
- ^ Маури А., Консонни В., Паван М. и Тодескини Р. (2006). Программное обеспечение Dragon: простой подход к расчетам молекулярных дескрипторов. Матчевая коммуникация в математической и компьютерной химии, 56 (2), 237–248.
- ^ Мориваки Х., Тиан Ю.С., Кавасита Н. и Такаги Т. (2018). Мордред: Калькулятор молекулярных дескрипторов. Журнал хеминформатики, 10 (1), 1–14. https://doi.org/10.1186/s13321-018-0258-y
- ^ Яп, CW (2011). PaDEL-дескриптор: программное обеспечение с открытым исходным кодом для расчета молекулярных дескрипторов и отпечатков пальцев. Журнал вычислительной химии. https://doi.org/10.1002/jcc.21707
Дальнейшее чтение [ править ]
- Роберто Тодескини и Вивиана Консонни, Молекулярные дескрипторы для хемоинформатики (2 тома), Wiley-VCH, 2009.
- Мати Карельсон, Молекулярные дескрипторы в QSAR/QSPR, John Wiley & Sons, 2000.
- Джеймс Девиллерс и Александру Т. Балабан (ред.), Топологические индексы и связанные с ними дескрипторы в QSAR и QSPR. Тейлор и Фрэнсис, 2000.
- Лемонт Кир и Лоуэлл Холл, Описание молекулярной структуры. Академик Пресс, 1999.
- Александру Т. Балабан (ред.), От химической топологии к трехмерной геометрии. Пленум Пресс, 1997.