Jump to content

Молекулярная добыча

этой странице описана добыча молекул На . Поскольку молекулы могут быть представлены молекулярными графами, это тесно связано с интеллектуальным анализом графов и структурированным анализом данных . Основная проблема заключается в том, как представлять молекулы, различая экземпляры данных. Одним из способов сделать это является метрика химического сходства , имеющая давнюю традицию в области хемоинформатики .

Типичные подходы к вычислению химического сходства используют химические отпечатки пальцев, но при этом теряется основная информация о топологии молекулы . Непосредственный анализ молекулярных графовпозволяет избежать этой проблемы. То же самое касается и обратной задачи QSAR , которая предпочтительнее для векторных отображений.

Кодирование (молекулы i , молекулы j≠i )

[ редактировать ]

Методы ядра

[ редактировать ]
  • маргинального графа Ядро [1]
  • Ядро оптимального назначения [2] [3] [4]
  • Фармакофорное ядро [5]
  • реализации C++ (и R) Объединение
    • ядро маргинального графа между помеченными графами [1]
    • расширения маргинального ядра [6]
    • Ядра Танимото [7]
    • ядра графов на основе древовидных шаблонов [8]
    • ядра на основе фармакофоров для трехмерной структуры молекул [5]

Методы максимального общего графа

[ редактировать ]
  • МКС -HSCS [9] (Стратегия ранжирования общей подструктуры с наивысшей оценкой (HSCS) для одного MCS)
  • малых молекул Детектор подграфов (SMSD) [10] - это программная библиотека на основе Java для расчета максимального общего подграфа (MCS) между небольшими молекулами. Это поможет нам найти сходство/расстояние между двумя молекулами. MCS также используется для скрининга соединений, подобных лекарственным средствам, путем выявления молекул, которые имеют общий подграф ( подструктуру ). [11]

Кодирование (молекулы и )

[ редактировать ]

Методы молекулярного запроса

[ редактировать ]

Методы, основанные на специальных архитектурах нейронных сетей

[ редактировать ]

См. также

[ редактировать ]
  1. ^ Jump up to: а б Х. Касима, К. Цуда, А. Инокучи, Маргинальные ядра между помеченными графами, 20-я Международная конференция по машинному обучению (ICML2003), 2003. PDF
  2. ^ Х. Фрелих, Дж. К. Вегнер, А. Зелл, Ядра оптимального назначения для атрибутированных молекулярных графов , 22-я Международная конференция по машинному обучению (ICML 2005), Omnipress, Мэдисон, Висконсин, США, 2005 , 225-232. PDF
  3. ^ Фрелих Х., Вегнер Дж. К., Зелл А. (2006). «Функции ядра для атрибутированных молекулярных графов - новый подход, основанный на сходстве, к прогнозированию ADME в классификации и регрессии». QSAR Гребень. Наука . 25 (4): 317–326. дои : 10.1002/qsar.200510135 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  4. ^ Х. Фрелих, Дж. К. Вегнер, А. Зелл, Ядра назначения для химических соединений , Международная совместная конференция по нейронным сетям 2005 (IJCNN'05), 2005 , 913-918. CiteSeer
  5. ^ Jump up to: а б Маэ П., Ралайвола Л., Стовен В., Верт Дж. (2006). «Фармакофорное ядро ​​для виртуального скрининга с использованием машин опорных векторов». Модель J Chem Inf . 46 (5): 2003–2014. arXiv : q-bio/0603006 . Бибкод : 2006q.bio.....3006M . дои : 10.1021/ci060138m . ПМИД   16995731 . S2CID   15060229 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  6. ^ П. Маэ, Н. Уэда, Т. Акуцу, Ж.-Л. Перре и П.Верт, Ж.-П. (2004). «Расширения маргинальных ядер графов». Материалы 21-го ICML : 552–559. {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  7. ^ Л. Ралайвола, С. Дж. Свамидасс, С. Хирото и П. Балди (2005). «Ядра графов для химической информатики». Нейронные сети . 18 (8): 1093–1110. дои : 10.1016/j.neunet.2005.07.009 . ПМИД   16157471 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  8. ^ П. Маэ и Ж.-П. Верт (2009). «Ядра графов на основе древовидных шаблонов молекул». Машинное обучение . 75 (1): 3–35. arXiv : q-bio/0609024 . дои : 10.1007/s10994-008-5086-2 . ISSN   0885-6125 . S2CID   5943581 .
  9. ^ Вегнер Дж. К., Фрелих Х., Миленц Х., Зелл А. (2006). «Интеллектуальный анализ данных и графов в химическом пространстве для наборов данных ADME и активности». QSAR Гребень. Наука . 25 (3): 205–220. дои : 10.1002/qsar.200510009 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  10. ^ Рахман С.А., Баштон М., Холлидей Г.Л., Шредер Р., Торнтон Дж.М. (2009). «Набор инструментов для детектора подграфов малых молекул (SMSD)» . Журнал хеминформатики . 1 (1): 12. дои : 10.1186/1758-2946-1-12 . ПМК   2820491 . ПМИД   20298518 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  11. ^ «Детектор подграфов малых молекул (СММС)» .
  12. ^ Кинг Р.Д., Шринивасан А., Дехаспе Л. (2001). «Wamr: инструмент интеллектуального анализа химических данных». J. Comput.-Aid. Мол. Дес . 15 (2): 173–181. Бибкод : 2001JCAMD..15..173K . дои : 10.1023/A:1008171016861 . ПМИД   11272703 . S2CID   3055046 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  13. ^ Л. Дехаспе, Х. Тойвонен, Кинг, Обнаружение частых подструктур в химических соединениях , 4-я Международная конференция по открытию знаний и интеллектуальному анализу данных, AAAI Press., 1998, 30-36.
  14. ^ А. Инокучи, Т. Васио, Т. Окада, Х. Мотода, Применение априорного метода анализа графов для анализа данных мутагенеза , Журнал компьютерной химии , 2001;, 2, 87-92.
  15. ^ А. Инокучи, Т. Васио, К. Нишимура, Х. Мотода, Быстрый алгоритм для анализа часто связанных подграфов , IBM Research, Токийская исследовательская лаборатория, 2002 .
  16. ^ А. Клэр, Р.Д. Кинг, Интеллектуальный анализ данных генома дрожжей на ленивом функциональном языке , Практические аспекты декларативных языков (PADL2003), 2003 .
  17. ^ Курамочи М., Карипис Г. (2004). «Эффективный алгоритм обнаружения частых подграфов». Транзакции IEEE по знаниям и инженерии данных . 16 (9): 1038–1051. CiteSeerX   10.1.1.107.3913 . дои : 10.1109/tkde.2004.33 . S2CID   242887 .
  18. ^ Дешпанде М., Курамочи М., Уэйл Н., Карипис Г. (2005). «Часто встречающиеся подходы к классификации химических соединений на основе субструктур». Транзакции IEEE по знаниям и инженерии данных . 17 (8): 1036–1050. дои : 10.1109/tkde.2005.127 . hdl : 11299/215559 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  19. ^ Хельма К., Крамер Т., Крамер С., де Рэдт Л. (2004). «Методы интеллектуального анализа данных и машинного обучения для идентификации субструктур, вызывающих мутагенность, и взаимосвязей между структурой и активностью неродственных соединений». Дж. Хим. Инф. Вычислить. Наука . 44 (4): 1402–1411. дои : 10.1021/ci034254q . ПМИД   15272848 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  20. ^ Т. Мейнл, К. Боргельт, М. Р. Бертольд, Дискриминационный анализ закрытых фрагментов и совершенные расширения в MoFa , Материалы второго симпозиума начинающих исследователей ИИ (STAIRS 2004), 2004 .
  21. ^ Т. Мейнл, К. Боргельт, М. Р. Бертольд, М. Филиппсен, Анализ фрагментов с нечеткими цепями в молекулярных базах данных , Второй международный семинар по интеллектуальному анализу графов, деревьев и последовательностей (MGTS2004), 2004 .
  22. ^ Мейнл, Т.; Бертольд, MR (2004). «Гибридный майнинг фрагментов с помощью MoFa и FSG» (PDF) . 2004 Международная конференция IEEE по системам, человеку и кибернетике (номер по каталогу IEEE 04CH37583) . Том. 5. С. 4559–4564. дои : 10.1109/ICSMC.2004.1401250 . ISBN  0-7803-8567-5 . S2CID   3248671 .
  23. ^ С. Нейссен, Дж. Н. Кок. Частый анализ графов и его применение к молекулярным базам данных , Труды конференции IEEE 2004 г. по системам, человеку и кибернетике (SMC2004), 2004 г.
  24. ^ К. Хельма, Прогнозная токсикология, CRC Press, 2005 .
  25. ^ М. Верляйн, Расширение и распараллеливание алгоритма анализа графов , Университет Фридриха-Александра, 2006 . PDF
  26. ^ К. Ян, С. Крамер, Оптимизация gSpan для наборов молекулярных данных , Материалы третьего международного семинара по интеллектуальному анализу графов, деревьев и последовательностей (MGTS-2005), 2005 .
  27. ^ X. Ян, Дж. Хан, gSpan: Анализ шаблонов подструктур на основе графов , Труды Международной конференции IEEE 2002 года по интеллектуальному анализу данных (ICDM 2002), IEEE Computer Society , 2002 , 721-724.
  28. ^ Карват А., Раедт Л.Д. (2006). «СМИРЭП: прогнозирование химической активности по SMILES» . Модель J Chem Inf . 46 (6): 2432–2444. дои : 10.1021/ci060159g . ПМИД   17125185 . S2CID   1460089 .
  29. ^ Андо Х., Дехаспе Л., Люйтен В., Краененбрук Э., Вандекастил Х., Меервелт Л. (2006). «Обнаружение правил Н-связи в кристаллах с помощью индуктивного логического программирования» . Мол Фарм . 3 (6): 665–674. дои : 10.1021/mp060034z . ПМИД   17140254 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  30. ^ Маццаторта П., Тран Л., Шилтер Б., Григоров М. (2007). «Интеграция взаимосвязей структура-активность и систем искусственного интеллекта для улучшения in silico прогнозирования мутагенности теста Эймса». Дж. Хим. Инф. Модель . 47 (1): 34–38. дои : 10.1021/ci600411v . ПМИД   17238246 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  31. ^ Уэйл Н., Карипис Г. «Сравнение пространств дескрипторов для поиска и классификации химических соединений». ИКДМ . 2006 : 678–689.
  32. ^ А. Гаго Алонсо, Дж. Э. Медина Пагола, Х. А. Карраско-Очоа и Х. Ф. Мартинес-Тринидад. Горное дело с подключенным подграфом, уменьшающее количество кандидатов , Proc. ECML--PKDD , стр. 365–376, 2008 г.
  33. ^ Сяохун Ван, Цзюнь Хуан, Аарон Смальтер, Джеральд Лашингтон, Применение функций ядра для точного поиска по сходству в больших химических базах данных , BMC Bioinformatics Vol. 11 (Приложение 3):S8 2010 .
  34. ^ Баскин, II; В.А. Палюлин; Н. С. Зефиров (1993). «[Методология поиска прямых корреляций между структурами и свойствами органических соединений с использованием вычислительных нейронных сетей]». Доклады Академии наук СССР . 333 (2): 176–179.
  35. ^ И.И. Баскин, В.А. Палюлин, Н.С. Зефиров (1997). «Нейронное устройство для поиска прямых корреляций между структурой и свойствами органических соединений». Дж. Хим. Инф. Вычислить. Наука . 37 (4): 715–721. дои : 10.1021/ci940128y . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  36. ^ Д.Б. Киреев (1995). «ChemNet: новый метод на основе нейронных сетей для отображения графиков/свойств». Дж. Хим. Инф. Вычислить. Наука . 35 (2): 175–180. дои : 10.1021/ci00024a001 .
  37. ^ А. М. Бьянуччи; Микели, Алессио; Спердути, Алессандро; Старита, Антонина (2000). «Применение сетей каскадной корреляции структур в химии». Прикладной интеллект . 12 (1–2): 117–146. дои : 10.1023/А:1008368105614 . S2CID   10031212 .
  38. ^ А. Микели, А. Спердути, А. Старита, А. М. Бьянуччи (2001). «Анализ внутренних представлений, разработанных нейронными сетями для структур, применяемый для количественных исследований взаимосвязи структура-активность бензодиазепинов». Дж. Хим. Инф. Вычислить. Наука . 41 (1): 202–218. CiteSeerX   10.1.1.137.2895 . дои : 10.1021/ci9903399 . ПМИД   11206375 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )
  39. ^ О. Иванчук (2001). «Кодирование молекулярной структуры в топологию искусственных нейронных сетей». Ежеквартальные обзоры румынской химической промышленности . 8 : 197–220.
  40. ^ А. Гулон, Т. Пико, А. Дюпра, Г. Дрейфус (2007). «Прогнозирование действий без вычислительных дескрипторов: графовые машины для QSAR». SAR и QSAR в экологических исследованиях . 18 (1–2): 141–153. дои : 10.1080/10629360601054313 . ПМИД   17365965 . S2CID   11759797 . {{cite journal}}: CS1 maint: несколько имен: список авторов ( ссылка )

Дальнейшее чтение

[ редактировать ]
  • Шёлкопф Б., К. Цуда и Дж. П. Верт: Методы ядра в вычислительной биологии , MIT Press, Кембридж, Массачусетс, 2004 .
  • Р.О. Дуда, П.Е. Харт, Д.Г. Сторк, Классификация моделей , John Wiley & Sons, 2001 . ISBN   0-471-05669-3
  • Гасфилд Д., Алгоритмы для строк, деревьев и последовательностей: информатика и вычислительная биология , Cambridge University Press, 1997 . ISBN   0-521-58519-8
  • Р. Тодескини, В. Консонни, Справочник по молекулярным дескрипторам , Wiley-VCH, 2000 . ISBN   3-527-29913-0
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: b47b19a8b7910b8bf55baaa0d752d499__1722774300
URL1:https://arc.ask3.ru/arc/aa/b4/99/b47b19a8b7910b8bf55baaa0d752d499.html
Заголовок, (Title) документа по адресу, URL1:
Molecule mining - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)