Молекулярная добыча
этой странице описана добыча молекул На . Поскольку молекулы могут быть представлены молекулярными графами, это тесно связано с интеллектуальным анализом графов и структурированным анализом данных . Основная проблема заключается в том, как представлять молекулы, различая экземпляры данных. Одним из способов сделать это является метрика химического сходства , имеющая давнюю традицию в области хемоинформатики .
Типичные подходы к вычислению химического сходства используют химические отпечатки пальцев, но при этом теряется основная информация о топологии молекулы . Непосредственный анализ молекулярных графовпозволяет избежать этой проблемы. То же самое касается и обратной задачи QSAR , которая предпочтительнее для векторных отображений.
Кодирование (молекулы i , молекулы j≠i )
[ редактировать ]Методы ядра
[ редактировать ]- маргинального графа Ядро [1]
- Ядро оптимального назначения [2] [3] [4]
- Фармакофорное ядро [5]
- реализации C++ (и R) Объединение
Методы максимального общего графа
[ редактировать ]- МКС -HSCS [9] (Стратегия ранжирования общей подструктуры с наивысшей оценкой (HSCS) для одного MCS)
- малых молекул Детектор подграфов (SMSD) [10] - это программная библиотека на основе Java для расчета максимального общего подграфа (MCS) между небольшими молекулами. Это поможет нам найти сходство/расстояние между двумя молекулами. MCS также используется для скрининга соединений, подобных лекарственным средствам, путем выявления молекул, которые имеют общий подграф ( подструктуру ). [11]
Кодирование (молекулы и )
[ редактировать ]Методы молекулярного запроса
[ редактировать ]- Теплый [12] [13]
- годовое общее собрание [14] [15]
- ПолиФАРМ [16]
- ФСГ [17] [18]
- МолФеа [19]
- МФА/МСС [20] [21] [22]
- Гастон [23]
- ЛАЗАР [24]
- ПарМол [25] (содержит MoFa, FFSM, gSpan и Gaston)
- оптимизированный gSpan [26] [27]
- СМИРЕП [28]
- ДМакс [29]
- SAm/AIm/RHC [30]
- Генерал АФ [31]
- gRed [32]
- G-хеш [33]
Методы, основанные на специальных архитектурах нейронных сетей
[ редактировать ]См. также
[ редактировать ]- Молекулярный язык запросов
- Теория химических графов
- Химический космос
- КСАР
- АДМЕ
- коэффициент разделения
Ссылки
[ редактировать ]- ^ Jump up to: а б Х. Касима, К. Цуда, А. Инокучи, Маргинальные ядра между помеченными графами, 20-я Международная конференция по машинному обучению (ICML2003), 2003. PDF
- ^ Х. Фрелих, Дж. К. Вегнер, А. Зелл, Ядра оптимального назначения для атрибутированных молекулярных графов , 22-я Международная конференция по машинному обучению (ICML 2005), Omnipress, Мэдисон, Висконсин, США, 2005 , 225-232. PDF
- ^ Фрелих Х., Вегнер Дж. К., Зелл А. (2006). «Функции ядра для атрибутированных молекулярных графов - новый подход, основанный на сходстве, к прогнозированию ADME в классификации и регрессии». QSAR Гребень. Наука . 25 (4): 317–326. дои : 10.1002/qsar.200510135 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Х. Фрелих, Дж. К. Вегнер, А. Зелл, Ядра назначения для химических соединений , Международная совместная конференция по нейронным сетям 2005 (IJCNN'05), 2005 , 913-918. CiteSeer
- ^ Jump up to: а б Маэ П., Ралайвола Л., Стовен В., Верт Дж. (2006). «Фармакофорное ядро для виртуального скрининга с использованием машин опорных векторов». Модель J Chem Inf . 46 (5): 2003–2014. arXiv : q-bio/0603006 . Бибкод : 2006q.bio.....3006M . дои : 10.1021/ci060138m . ПМИД 16995731 . S2CID 15060229 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ П. Маэ, Н. Уэда, Т. Акуцу, Ж.-Л. Перре и П.Верт, Ж.-П. (2004). «Расширения маргинальных ядер графов». Материалы 21-го ICML : 552–559.
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Л. Ралайвола, С. Дж. Свамидасс, С. Хирото и П. Балди (2005). «Ядра графов для химической информатики». Нейронные сети . 18 (8): 1093–1110. дои : 10.1016/j.neunet.2005.07.009 . ПМИД 16157471 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ П. Маэ и Ж.-П. Верт (2009). «Ядра графов на основе древовидных шаблонов молекул». Машинное обучение . 75 (1): 3–35. arXiv : q-bio/0609024 . дои : 10.1007/s10994-008-5086-2 . ISSN 0885-6125 . S2CID 5943581 .
- ^ Вегнер Дж. К., Фрелих Х., Миленц Х., Зелл А. (2006). «Интеллектуальный анализ данных и графов в химическом пространстве для наборов данных ADME и активности». QSAR Гребень. Наука . 25 (3): 205–220. дои : 10.1002/qsar.200510009 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Рахман С.А., Баштон М., Холлидей Г.Л., Шредер Р., Торнтон Дж.М. (2009). «Набор инструментов для детектора подграфов малых молекул (SMSD)» . Журнал хеминформатики . 1 (1): 12. дои : 10.1186/1758-2946-1-12 . ПМК 2820491 . ПМИД 20298518 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ «Детектор подграфов малых молекул (СММС)» .
- ^ Кинг Р.Д., Шринивасан А., Дехаспе Л. (2001). «Wamr: инструмент интеллектуального анализа химических данных». J. Comput.-Aid. Мол. Дес . 15 (2): 173–181. Бибкод : 2001JCAMD..15..173K . дои : 10.1023/A:1008171016861 . ПМИД 11272703 . S2CID 3055046 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Л. Дехаспе, Х. Тойвонен, Кинг, Обнаружение частых подструктур в химических соединениях , 4-я Международная конференция по открытию знаний и интеллектуальному анализу данных, AAAI Press., 1998, 30-36.
- ^ А. Инокучи, Т. Васио, Т. Окада, Х. Мотода, Применение априорного метода анализа графов для анализа данных мутагенеза , Журнал компьютерной химии , 2001;, 2, 87-92.
- ^ А. Инокучи, Т. Васио, К. Нишимура, Х. Мотода, Быстрый алгоритм для анализа часто связанных подграфов , IBM Research, Токийская исследовательская лаборатория, 2002 .
- ^ А. Клэр, Р.Д. Кинг, Интеллектуальный анализ данных генома дрожжей на ленивом функциональном языке , Практические аспекты декларативных языков (PADL2003), 2003 .
- ^ Курамочи М., Карипис Г. (2004). «Эффективный алгоритм обнаружения частых подграфов». Транзакции IEEE по знаниям и инженерии данных . 16 (9): 1038–1051. CiteSeerX 10.1.1.107.3913 . дои : 10.1109/tkde.2004.33 . S2CID 242887 .
- ^ Дешпанде М., Курамочи М., Уэйл Н., Карипис Г. (2005). «Часто встречающиеся подходы к классификации химических соединений на основе субструктур». Транзакции IEEE по знаниям и инженерии данных . 17 (8): 1036–1050. дои : 10.1109/tkde.2005.127 . hdl : 11299/215559 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Хельма К., Крамер Т., Крамер С., де Рэдт Л. (2004). «Методы интеллектуального анализа данных и машинного обучения для идентификации субструктур, вызывающих мутагенность, и взаимосвязей между структурой и активностью неродственных соединений». Дж. Хим. Инф. Вычислить. Наука . 44 (4): 1402–1411. дои : 10.1021/ci034254q . ПМИД 15272848 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Т. Мейнл, К. Боргельт, М. Р. Бертольд, Дискриминационный анализ закрытых фрагментов и совершенные расширения в MoFa , Материалы второго симпозиума начинающих исследователей ИИ (STAIRS 2004), 2004 .
- ^ Т. Мейнл, К. Боргельт, М. Р. Бертольд, М. Филиппсен, Анализ фрагментов с нечеткими цепями в молекулярных базах данных , Второй международный семинар по интеллектуальному анализу графов, деревьев и последовательностей (MGTS2004), 2004 .
- ^ Мейнл, Т.; Бертольд, MR (2004). «Гибридный майнинг фрагментов с помощью MoFa и FSG» (PDF) . 2004 Международная конференция IEEE по системам, человеку и кибернетике (номер по каталогу IEEE 04CH37583) . Том. 5. С. 4559–4564. дои : 10.1109/ICSMC.2004.1401250 . ISBN 0-7803-8567-5 . S2CID 3248671 .
- ^ С. Нейссен, Дж. Н. Кок. Частый анализ графов и его применение к молекулярным базам данных , Труды конференции IEEE 2004 г. по системам, человеку и кибернетике (SMC2004), 2004 г.
- ^ К. Хельма, Прогнозная токсикология, CRC Press, 2005 .
- ^ М. Верляйн, Расширение и распараллеливание алгоритма анализа графов , Университет Фридриха-Александра, 2006 . PDF
- ^ К. Ян, С. Крамер, Оптимизация gSpan для наборов молекулярных данных , Материалы третьего международного семинара по интеллектуальному анализу графов, деревьев и последовательностей (MGTS-2005), 2005 .
- ^ X. Ян, Дж. Хан, gSpan: Анализ шаблонов подструктур на основе графов , Труды Международной конференции IEEE 2002 года по интеллектуальному анализу данных (ICDM 2002), IEEE Computer Society , 2002 , 721-724.
- ^ Карват А., Раедт Л.Д. (2006). «СМИРЭП: прогнозирование химической активности по SMILES» . Модель J Chem Inf . 46 (6): 2432–2444. дои : 10.1021/ci060159g . ПМИД 17125185 . S2CID 1460089 .
- ^ Андо Х., Дехаспе Л., Люйтен В., Краененбрук Э., Вандекастил Х., Меервелт Л. (2006). «Обнаружение правил Н-связи в кристаллах с помощью индуктивного логического программирования» . Мол Фарм . 3 (6): 665–674. дои : 10.1021/mp060034z . ПМИД 17140254 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Маццаторта П., Тран Л., Шилтер Б., Григоров М. (2007). «Интеграция взаимосвязей структура-активность и систем искусственного интеллекта для улучшения in silico прогнозирования мутагенности теста Эймса». Дж. Хим. Инф. Модель . 47 (1): 34–38. дои : 10.1021/ci600411v . ПМИД 17238246 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Уэйл Н., Карипис Г. «Сравнение пространств дескрипторов для поиска и классификации химических соединений». ИКДМ . 2006 : 678–689.
- ^ А. Гаго Алонсо, Дж. Э. Медина Пагола, Х. А. Карраско-Очоа и Х. Ф. Мартинес-Тринидад. Горное дело с подключенным подграфом, уменьшающее количество кандидатов , Proc. ECML--PKDD , стр. 365–376, 2008 г.
- ^ Сяохун Ван, Цзюнь Хуан, Аарон Смальтер, Джеральд Лашингтон, Применение функций ядра для точного поиска по сходству в больших химических базах данных , BMC Bioinformatics Vol. 11 (Приложение 3):S8 2010 .
- ^ Баскин, II; В.А. Палюлин; Н. С. Зефиров (1993). «[Методология поиска прямых корреляций между структурами и свойствами органических соединений с использованием вычислительных нейронных сетей]». Доклады Академии наук СССР . 333 (2): 176–179.
- ^ И.И. Баскин, В.А. Палюлин, Н.С. Зефиров (1997). «Нейронное устройство для поиска прямых корреляций между структурой и свойствами органических соединений». Дж. Хим. Инф. Вычислить. Наука . 37 (4): 715–721. дои : 10.1021/ci940128y .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Д.Б. Киреев (1995). «ChemNet: новый метод на основе нейронных сетей для отображения графиков/свойств». Дж. Хим. Инф. Вычислить. Наука . 35 (2): 175–180. дои : 10.1021/ci00024a001 .
- ^ А. М. Бьянуччи; Микели, Алессио; Спердути, Алессандро; Старита, Антонина (2000). «Применение сетей каскадной корреляции структур в химии». Прикладной интеллект . 12 (1–2): 117–146. дои : 10.1023/А:1008368105614 . S2CID 10031212 .
- ^ А. Микели, А. Спердути, А. Старита, А. М. Бьянуччи (2001). «Анализ внутренних представлений, разработанных нейронными сетями для структур, применяемый для количественных исследований взаимосвязи структура-активность бензодиазепинов». Дж. Хим. Инф. Вычислить. Наука . 41 (1): 202–218. CiteSeerX 10.1.1.137.2895 . дои : 10.1021/ci9903399 . ПМИД 11206375 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ О. Иванчук (2001). «Кодирование молекулярной структуры в топологию искусственных нейронных сетей». Ежеквартальные обзоры румынской химической промышленности . 8 : 197–220.
- ^ А. Гулон, Т. Пико, А. Дюпра, Г. Дрейфус (2007). «Прогнозирование действий без вычислительных дескрипторов: графовые машины для QSAR». SAR и QSAR в экологических исследованиях . 18 (1–2): 141–153. дои : 10.1080/10629360601054313 . ПМИД 17365965 . S2CID 11759797 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка )
Дальнейшее чтение
[ редактировать ]- Шёлкопф Б., К. Цуда и Дж. П. Верт: Методы ядра в вычислительной биологии , MIT Press, Кембридж, Массачусетс, 2004 .
- Р.О. Дуда, П.Е. Харт, Д.Г. Сторк, Классификация моделей , John Wiley & Sons, 2001 . ISBN 0-471-05669-3
- Гасфилд Д., Алгоритмы для строк, деревьев и последовательностей: информатика и вычислительная биология , Cambridge University Press, 1997 . ISBN 0-521-58519-8
- Р. Тодескини, В. Консонни, Справочник по молекулярным дескрипторам , Wiley-VCH, 2000 . ISBN 3-527-29913-0
Внешние ссылки
[ редактировать ]- Детектор подграфов малых молекул (SMSD) — это программная библиотека на основе Java для расчета максимального общего подграфа (MCS) между небольшими молекулами.
- 5-й международный семинар по горному делу и обучению с помощью графиков, 2007 г.
- Обзор за 2006 год
- Молекулярный майнинг (базовые химические экспертные системы)
- Документация по ParMol и магистерской диссертации . Java. Открытый исходный код. Распределенный майнинг. Библиотека эталонных алгоритмов.
- TU München - группа Kramer
- Молекулярный майнинг (передовые химические экспертные системы)
- DMax Chemistry Assistant — коммерческое программное обеспечение
- AFGen — программное обеспечение для генерации дескрипторов на основе фрагментов.