Генератор химических графов
Генератор химических графов — это пакет программного обеспечения для создания компьютерных представлений химических структур, соответствующих определенным граничным условиям . Разработка таких пакетов программного обеспечения является темой исследований хеминформатики . Генераторы химических графов используются в таких областях, как виртуальной библиотеки создание при разработке лекарств , молекулярном дизайне с заданными свойствами, называемом обратным QSAR/QSPR , а также при проектировании органического синтеза , ретросинтезе или в системах компьютерного определения структуры (CASE). . Системы CASE вновь вернули интерес к выяснению структуры неизвестных в вычислительной метаболомике , современной области вычислительной биологии .
История
[ редактировать ]
Генерация молекулярной структуры — это ветвь задач генерации графов . [1] Молекулярные структуры представляют собой графики с химическими ограничениями, такими как валентности , кратность связей и фрагменты. Эти генераторы являются ядром систем CASE. В генераторе молекулярная формула является основным входным сигналом. Если фрагменты получены из экспериментальных данных, их также можно использовать в качестве входных данных для ускорения генерации структур. Первые генераторы структур представляли собой версии генераторов графов, модифицированные для химических целей. Одним из первых генераторов структур был CONGEN, [2] Первоначально разработанный для проекта DENDRAL , первого проекта искусственного интеллекта в органической химии . [3] Дендрал был разработан в рамках программы Маринер, запущенной НАСА по поиску жизни на Марсе. [4] [5] CONGEN хорошо справился с дублированием подструктур. перекрытия между подструктурами, а не атомы В качестве строительных блоков использовались . В случае стереоизомеров . были выполнены расчеты групп симметрии для обнаружения дубликатов
После ДЕНДРАЛА появился еще один математический метод, МАССА. [6] Сообщалось об инструменте для математического синтеза и анализа молекулярных структур. Как и в случае с CONGEN, алгоритм MASS работал как генератор матрицы смежности . Многие математические генераторы являются потомками эффективных методов ветвей и границ Игоря Фараджева. [7] и Рональда К. Рида . метод упорядоченной генерации [8] Хотя их отчеты относятся к 1970-м годам, эти исследования до сих пор являются фундаментальными источниками информации для генераторов структур. В методе упорядоченной генерации определенные функции проверки порядка выполняются над представителями графа, такими как векторы. Например, МОЛГЕН [9] выполняет проверку по убыванию при заполнении строк матриц смежности. Эта проверка в порядке убывания основана на распределении входных валентностей. В литературе генераторы подразделяются на два основных типа: сборка конструкции и уменьшение конструкции. алгоритмическая сложность и время выполнения Критериями сравнения являются .
Сборка конструкции
[ редактировать ]Процесс генерации начинается с набора атомов из молекулярной формулы . При сборке структуры атомы комбинаторно соединяются, чтобы учесть все возможные расширения. Если подструктуры получены из экспериментальных данных , генерация начинается с этих подструктур. Эти субструктуры обеспечивают известные связи в молекуле. Одна из первых попыток была предпринята Хидэцугу Абэ в 1975 году с использованием генератора структур на основе распознавания образов . [10] Алгоритм состоял из двух этапов: во-первых, прогнозирование подструктуры на основе спектральных данных низкого разрешения; во-вторых, сборка этих подконструкций на основе набора строительных правил. Хидецугу Абэ и другие авторы опубликовали первую статью по ХИМИИ. [11] это CASE-инструмент, включающий несколько методов генерации структур. Программа опирается на предопределенную библиотеку непересекающихся фрагментов. CHEMICS генерирует различные типы наборов компонентов, ранжированных от первичного до третичного, в зависимости от сложности компонента. Первичный набор содержит атомы, т. е. C , N , O и S , с их гибридизацией . Наборы вторичных и третичных компонентов строятся слой за слоем, начиная с этих первичных компонентов. Эти наборы компонентов представлены в виде векторов и используются в качестве строительных блоков в процессе.
Существенный вклад внесли Крейг Шелли и Мортон Манк, опубликовавшие большое количество статей CASE в этой области. В первой из этих статей сообщалось о генераторе структур ASSEMBLE. [12] Алгоритм считается одним из первых методов сборки в этой области. Как следует из названия, алгоритм собирает перекрывающиеся подструктуры для построения структур. ASSEMBLE преодолевает перекрытие, включая «тег соседнего атома». Генератор является чисто математическим и не требует интерпретации каких-либо спектральных данных. Спектральные данные используются для оценки структуры и информации о подструктуре. Генератор на основе молекулярной формулы формирует связи между парами атомов, а все расширения проверяются на соответствие заданным ограничениям. Если процесс рассматривать как дерево , то первый узел дерева представляет собой набор атомов с подструктурами, если таковые предусмотрены спектральными данными. Удлиняя молекулу связью, строится промежуточная структура. Каждая промежуточная структура может быть представлена узлом дерева генерации. ASSEMBLE был разработан с удобным интерфейсом для облегчения использования. Вторая версия ASSEMBLE была выпущена в 2000 году. [13] Другой метод сборки — ГЕНУЯ. [14] По сравнению с ASSEMBLE и многими другими генераторами, GENOA представляет собой конструктивный алгоритм поиска подструктур, который собирает различные подструктуры, также учитывая перекрытия.
Эффективность и полнота генераторов также связаны со структурами данных. В отличие от предыдущих методов, AEGIS [15] был генератором обработки списков. По сравнению с матрицами смежности данные списка требуют меньше памяти . Поскольку в этой системе не интерпретировались никакие спектральные данные, пользователю необходимо было предоставить подструктуры в качестве входных данных. Генераторы структур также могут различаться в зависимости от типа используемых данных, таких как HMBC , HSQC и другие ЯМР данные . LUCY — это метод определения структуры с открытым исходным кодом, основанный на данных HMBC о неизвестных молекулах. [16] и включает в себя исчерпывающий двухэтапный процесс генерации структуры, в котором сначала все комбинации интерпретаций сигналов HMBC реализуются в матрице связности, которая затем завершается детерминированным генератором, заполняющим недостающую информацию о связях. Эта платформа могла генерировать структуры с любым произвольным размером молекул; однако молекулярные формулы с более чем 30 тяжелыми атомами отнимают слишком много времени для практического применения. Это ограничение подчеркнуло необходимость новой системы CASE. SENECA была разработана для устранения недостатков LUCY. [17] Чтобы преодолеть ограничения исчерпывающего подхода, SENECA был разработан как стохастический метод поиска оптимальных решений. Системы включают в себя два стохастических метода: имитацию отжига и генетические алгоритмы . Сначала генерируется случайная структура; затем рассчитывается его энергия для оценки структуры и ее спектральных свойств. Преобразуя эту структуру в другую, процесс продолжается до тех пор, пока не будет достигнута оптимальная энергия . При генерации это преобразование основано на уравнениях, основанных на правилах Жана-Лу Фаулона. [18] LSD (Логика определения структуры) [19] является важным вкладом французских ученых. Инструмент использует информацию о спектральных данных, такую как данные HMBC и COSY, для создания всех возможных структур. LSD — это генератор структур с открытым исходным кодом, выпущенный под лицензией General Public License (GPL) . Известная коммерческая CASE-система StrucEluc. [20] также оснащен генератором на основе ЯМР. Этот инструмент создан компанией ACD Labs и, в частности, одним из разработчиков MASS Михаилом Эльяшбергом. КОКОН [21] это еще один генератор структур на основе ЯМР, основанный на наборах теоретических данных для генерации структур. За исключением J-HMBC и J-COSY, в качестве входных данных можно использовать все типы ЯМР.
В 1994 году Ху и Сюй сообщили о генераторе структур на основе целочисленных разделов . [22] Разложение молекулярной формулы на фрагменты, компоненты и сегменты осуществлялось с использованием целочисленного разделения. Эти фрагменты затем использовались в качестве строительных блоков в генераторе структур. Этот генератор структур был частью системы CASE, ESESOC. [23]

О серии стохастических генераторов сообщил Жан-Лу Фаулон. Программное обеспечение МОЛСИГ, [24] был интегрирован в этот стохастический генератор для канонической маркировки и проверки дубликатов. [25] Как и для многих других генераторов, древовидный подход является основой структурных генераторов Жана-Лу Фаулона. Однако рассмотрение всех возможных расширений приводит к комбинаторному взрыву . Чтобы справиться с этой исчерпываемостью, выполняется упорядоченная генерация. Многие алгоритмы сборки, такие как OMG, [26] МОЛЬГЕН и структурный генератор Жана-Лу Фаулона, [27] — это методы упорядоченной генерации. Генератор структур Жана-Лу Фаулона основан на классах эквивалентности атомов. Атомы с одинаковым типом взаимодействия и элементом группируются в одном классе эквивалентности. Вместо того, чтобы расширять все атомы в молекуле, один атом каждого класса связан с другими атомами. Подобно первому генератору, генератор структур Хулио Пейронсели, OMG, принимает атомы и подструктуры в качестве входных данных и расширяет структуры, используя метод поиска в ширину . Это расширение дерева прекращается, когда все ветви достигают насыщенных структур.
OMG генерирует структуры на основе метода канонического дополнения из пакета NAUTY Брендана Маккея. Алгоритм вычисляет каноническую маркировку, а затем расширяет структуры, добавляя одну связь. Чтобы расширение оставалось каноническим, добавляются канонические связи. [28] Хотя NAUTY является эффективным инструментом для канонической разметки графов, OMG примерно в 2000 раз медленнее, чем MOLGEN. [29] Проблема в хранении всех промежуточных структур. С тех пор OMG был распараллелен , и разработчики выпустили PMG (Parallel Molecule Generator). [30] MOLGEN превосходит PMG, используя всего одно ядро; однако PMG превосходит MOLGEN, увеличивая количество ядер до 10.
Алгоритм конструктивного поиска — это метод ветвей и границ , такой как алгоритм Игоря Фараджева, и дополнительное решение проблем с памятью. Методы ветвей и границ представляют собой алгоритмы формирования матриц . В отличие от предыдущих методов, эти методы строят все матрицы связности без построения промежуточных структур. В этих алгоритмах критерии каноничности и проверки изоморфизма основаны на группах автоморфизмов из математической теории групп . МАССА, СМОГ [31] и алгоритм Ивана Бангова [32] хорошие примеры в литературе. МАСС – это метод математического синтеза. Во-первых, он строит все матрицы инцидентности для данной молекулярной формулы. Валентности атомов затем используются в качестве входных данных для генерации матрицы. Матрицы генерируются путем рассмотрения всех возможных взаимодействий между атомами с учетом ограничений и валентностей. Преимущество конструктивных алгоритмов поиска заключается в низком использовании памяти. SMOG является преемником MASS.
В отличие от предыдущих методов, MOLGEN является единственным поддерживаемым эффективным генератором общих структур, разработанным как платформа с закрытым исходным кодом группой математиков в качестве приложения вычислительной теории групп . МОЛГЕН — это метод упорядоченной генерации. Было разработано множество различных версий MOLGEN, предоставляющих различные функции. В зависимости от потребностей пользователей могут использоваться различные типы входных данных. Например, МОЛГЕН-МС [33] позволяет пользователям вводить данные масс-спектрометрии неизвестной молекулы. По сравнению со многими другими генераторами, MOLGEN подходит к проблеме с разных сторон. Ключевая особенность MOLGEN — генерация структур без построения всех промежуточных структур и без создания дубликатов.
В этой области исследования, проведенные в 2021 году исследовательской группой Кимито Фунацу . В качестве метода сборки при создании структуры используются строительные блоки, такие как кольцевые системы и фрагменты атомов. [34] Каждая промежуточная структура расширяется путем добавления строительных блоков всеми возможными способами. Чтобы уменьшить количество дубликатов, используется метод канонического увеличения пути Брендана Маккея. Чтобы преодолеть комбинаторный взрыв в генерации, область применимости и кольцевые системы обнаруживаются на основе обратного анализа QSPR/QSAR . [35] Область применимости или целевая область описывается на основе предоставленной информации о биологической и фармацевтической активности из QSPR/QSAR. [36] В этом исследовании для описания областей применимости используются монотонно изменяемые дескрипторы (MCD). Для каждого расширения в промежуточных структурах обновляются MCD. Использование MCD сокращает пространство поиска в процессе генерации. При генерации структур на основе QSPR/QSAR отсутствует синтезируемость сгенерированных структур. Использование путей ретросинтеза в генерации делает процесс генерации более эффективным. Например, известный инструмент RetroPath. [37] используется для определения молекулярной структуры и виртуального скрининга на основе заданных правил реакции. [38] Его основной алгоритм — это метод в ширину, генерирующий структуры путем применения правил реакции к каждому исходному соединению. Генерация и перечисление структур выполняются на основе канонического метода увеличения Брендана Маккея. RetroPath 2.0 предоставляет различные рабочие процессы, такие как преобразование изомеров, перечисление, QSAR и метаболомика .
Помимо этих методов генерации математических структур, реализации нейронных сетей , такие как генеративного автокодировщика , модели [39] [40] являются новыми направлениями в этой области.
Сокращение структуры
[ редактировать ]В отличие от этих методов сборки, методы редукции создают все связи между парами атомов, образуя гиперграф. Затем размер графа уменьшается с учетом ограничений. Сначала проверяется наличие подструктур в гиперграфе. В отличие от методов сборки, дерево генерации начинается с гиперграфа, и на каждом шаге структуры уменьшаются в размерах. Облигации удаляются на основе подструктур. Если подструктуры больше нет в гиперграфе, она удаляется из ограничений. Перекрытия в подструктурах также учитывались из-за гиперграфов. Самый ранний генератор структур на основе редукции - COCOA. [41] исчерпывающий и рекурсивный метод удаления связей. Сгенерированные фрагменты описываются как атомоцентрированные фрагменты для оптимизации хранения, сравнимые с круговыми отпечатками пальцев. [42] и подписи атомов. [43] Вместо хранения структур сохраняется только список первых соседей каждого атома. Основным недостатком методов редукции является огромный размер гиперграфов. Действительно, для молекул с неизвестной структурой размер гиперструктуры становится чрезвычайно большим, что приводит к пропорциональному увеличению времени выполнения.
Генератор структуры GEN [44] Симоны Боханец объединяет две задачи: сборку конструкции и уменьшение конструкции. Как и в случае с COCOA, исходное состояние проблемы — это гиперструктура. Как методы сборки, так и методы сокращения имеют свои преимущества и недостатки, и инструмент GEN позволяет избежать этих недостатков на этапе генерации. Другими словами, уменьшение структуры эффективно, когда предусмотрены структурные ограничения, а сборка структуры происходит быстрее без ограничений. Сначала устраняются ненужные соединения, а затем собираются подконструкции для построения конструкций. Таким образом, GEN более эффективно справляется с ограничениями, комбинируя эти методы. GEN удаляет соединения, создающие запрещенные структуры, а затем матрицы соединений заполняются на основе информации о подструктуре. Этот метод не допускает дублирования подструктур. После того как структура построена в матричном представлении, насыщенная молекула сохраняется в выходном списке. Метод COCOA был усовершенствован, и был построен новый генератор HOUDINI. [45] Он опирается на две структуры данных: строится квадратная матрица соединений, представляющая все связи в гиперструктуре, и, во-вторых, представление субструктуры используется для перечисления атомоцентрированных фрагментов. При генерации структуры HOUDINI отображает все атомно-центрированные фрагменты на гиперструктуру.
Математическая основа
[ редактировать ]Химические графики
[ редактировать ]
В графе, представляющем химическую структуру, вершины и ребра представляют атомы и связи соответственно. Порядок связи соответствует кратности ребер , и в результате химические графы представляют собой графы с метками вершин и ребер . Граф с метками вершин и ребер описывается как химический график, где – множество вершин, т.е. атомов, и - это набор ребер, который представляет связи.
В теории графов степень вершины — это количество ее связей. В химическом графике максимальная степень атома — это его валентность и максимальное количество связей, которые может образовать химический элемент. Например, валентность углерода равна 4. На химическом графике атом считается насыщенным, если он достигает своей валентности. Граф связный , если между каждой парой вершин существует хотя бы один путь. Хотя химические смеси [46] являются одним из основных интересов многих химиков , поскольку из-за вычислительного взрыва многие генераторы структур выдают только связанные химические графики. Таким образом, проверка связности является одним из обязательных промежуточных этапов генерации структуры, поскольку целью является создание полностью насыщенных молекул. Молекула называется насыщенной, если все ее атомы насыщены.
Группы симметрии молекулярных графов
[ редактировать ]Для набора элементов перестановка — это перестановка этих элементов. [47] Пример приведен ниже:
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | |
4 | 2 | 11 | 6 | 1 | 5 | 8 | 9 | 7 | 10 | 3 |
Вторая строка этой таблицы показывает перестановку первой строки. Умножение перестановок, и , определяется как композиция функций , как показано ниже.
Комбинация двух перестановок также является перестановкой. Группа , , представляет собой набор элементов вместе с ассоциативной бинарной операцией определено на такие, что верно следующее:
- Есть элемент в удовлетворяющий , для всех элементов из .
- Для каждого элемента G существует элемент такой, что равен единичному элементу .
Порядок группы — это количество элементов в группе. Давайте предположим представляет собой набор целых чисел. В ходе операции композиции функций — группа симметрии , набор всех перестановок над X. Если размер является , то порядок является . Системы множеств состоят из конечного множества и его подмножества , называемые блоками множества. Набор перестановок, сохраняющий систему множеств, используется для построения автоморфизмов графа. Автоморфизм переставляет вершины графа; другими словами, он отображает граф сам на себя. Это действие сохраняет ребро-вершину. Если является ребром графа, , и представляет собой перестановку , затем
Перестановка из является автоморфизмом графа если
Группа автоморфизмов графа , обозначенный , — множество всех автоморфизмов на . В молекулярных графах каноническая маркировка и обнаружение молекулярной симметрии являются реализациями групп автоморфизмов. Хотя в этой области существуют хорошо известные канонические методы маркировки, такие как InChI. [48] и крылатый [49] NAUTY — это широко используемый пакет программного обеспечения для расчета групп автоморфизмов и канонической маркировки.
Список доступных генераторов структур
[ редактировать ]Доступные пакеты программного обеспечения и ссылки на них перечислены ниже.
Имя | Связь |
---|---|
СОБЕРИТЬ | www |
КОКОН | кокон |
ДЕНДРАЛЬНЫЙ КОНГЕН+ГЕНУЯ | www |
ЛСД | Эос |
МАЙГЕН | майгенератор |
МОЛГЕН | www |
МОЛСИГ | Молсиг |
МОЙ БОГ | исходная кузня |
ПМГ | исходная кузня |
СЕНЕКА | github |
SMOG | ccl |
Всплеск | Генератор структуры |
См. также
[ редактировать ]Ссылки
[ редактировать ] Эта статья была адаптирована из следующего источника под лицензией CC BY 4.0 ( 2021 г. ) ( отчеты рецензента ): Мехмет Азиз Йирик; Кристоф Стейнбек (5 января 2021 г.). «Химические графовые генераторы» . PLOS Вычислительная биология . 17 (1): e1008504. doi : 10.1371/JOURNAL.PCBI.1008504 . ISSN 1553-734X . ПМЦ 7785115 . ПМИД 33400699 . Викиданные Q104747658 .
- ^ Йирик, Мехмет Азиз; Стейнбек, Кристоф (5 января 2021 г.). «Химические графовые генераторы» . PLOS Вычислительная биология . 17 (1): e1008504. Бибкод : 2021PLSCB..17E8504Y . дои : 10.1371/journal.pcbi.1008504 . ПМЦ 7785115 . ПМИД 33400699 .
- ^ Брукколери RE; Карплюс М (1 января 1987 г.). «Прогнозирование сворачивания коротких полипептидных сегментов с помощью однородной конформационной выборки». Биополимеры . 26 (1): 137–168. дои : 10.1002/BIP.360260114 . ISSN 0006-3525 . ПМИД 3801593 . Викиданные Q69715633 .
- ^ Сазерленд, Дж. (15 февраля 1967 г.). «ДЕНДРАЛ-компьютерная программа для генерации и фильтрации химических структур» . ОТДЕЛ ИНФОРМАТИКИ . Стэнфордский университет.
- ^ Роберт К. Линдси; Брюс Г. Бьюкенен; Эдвард А. Фейгенбаум ; Джошуа Ледерберг (июнь 1993 г.). «ДЕНДРАЛ: пример первой экспертной системы для формирования научных гипотез». Искусственный интеллект . 61 (2): 209–261. дои : 10.1016/0004-3702(93)90068-М . ISSN 0004-3702 . Викиданные Q29387651 .
- ^ Карина Анатольевна Гуляева; Ирина Львовна Артемьева (2020). «Онтологический подход в разработке интеллектуальных систем органической химии». Достижения в области интеллектуальных систем и вычислений : 69–78. дои : 10.1007/978-981-32-9343-4_7 . ISSN 2194-5357 . Викиданные Q105092432 .
- ^ В.В. Серов; М.Э. Эльяшберг; Л. А. Грибов (апрель 1976 г.). «Математический синтез и анализ молекулярных структур». Журнал молекулярной структуры . 31 (2): 381–397. дои : 10.1016/0022-2860(76)80018-X . ISSN 0022-2860 . Викиданные Q99232065 .
- ^ Фарадзев И.А. (1978). «Конструктивное перечисление комбинаторных объектов». Коллок. Интерн. ЦНРС . 260 : 131–135.
- ^ Чарльз Дж. Колборн ; Рональд К. Рид (1979). «Упорядоченные алгоритмы генерации ограниченных классов графов». Журнал теории графов . 3 (2): 187–195. дои : 10.1002/JGT.3190030210 . ISSN 0364-9024 . Збл 0404.05051 . Викиданные Q99232279 .
- ^ Грюнер, Т; Лауэ, Р; Мерингер, М; Байройт, Ю (1997). «Алгоритмы групповых действий: принцип гомоморфизма и упорядоченная генерация применительно к графам» . Серия DIMACS по дискретной математике и теоретической информатике . стр. 113–22.
- ^ Хидэцугу. Эйб; Питер К. Джурс (сентябрь 1975 г.). «Автоматизированный анализ химической структуры органических молекул с помощью генератора молекулярной структуры и методов распознавания образов». Аналитическая химия . 47 (11): 1829–1835. дои : 10.1021/AC60361A007 . ISSN 0003-2700 . Викиданные Q99232471 .
- ^ Синъити Сасаки; Хидэцугу Абэ; Юджи Хирота; Ёсиаки Исида; Ёсихиро Кудо; Шукичи Отиай; Кейджи Сайто; Тору Ямасаки (1 ноября 1978 г.). «ХИМИКА-Ф: Компьютерная программная система для определения структуры органических соединений». Журнал химической информации и компьютерных наук . 18 (4): 211–222. дои : 10.1021/CI60016A007 . ISSN 1520-5142 . Викиданные Q99233202 .
- ^ Крейг А. Шелли; Мортон Э. Мунк (ноябрь 1981 г.). «Кейс, компьютерная модель процесса выяснения структуры». Аналитика Химика Акта . 133 (4): 507–516. дои : 10.1016/S0003-2670(01)95416-9 . ISSN 0003-2670 . Викиданные Q99233261 .
- ^ Мартин Бадерчер; Андрей Корытько; Клаус-Петер Шульц; и др. (май 2000 г.). «Ассемблер 2.0: генератор структур». Хемометрика и интеллектуальные лабораторные системы . 51 (1): 73–79. дои : 10.1016/S0169-7439(00)00056-3 . ISSN 0169-7439 . Викиданные Q99233839 .
- ^ Раймонд Э. Кархарт; Деннис Х. Смит; Нил А.Б. Грей; Джеймс Дж. Норс; Карл Джерасси (апрель 1981 г.). «Применение искусственного интеллекта для химического вывода. 37. ГЕНУЯ: компьютерная программа для выяснения структуры с использованием перекрывающихся и альтернативных подструктур». Журнал органической химии . 46 (8): 1708–1718. дои : 10.1021/JO00321A037 . ISSN 0022-3263 . Викиданные Q99233344 .
- ^ Х. Дж. Луинге; Дж. Х. Ван дер Маас (июнь 1990 г.). «AEGIS, алгоритм исчерпывающей генерации неизбыточных структур». Хемометрика и интеллектуальные лабораторные системы . 8 (2): 157–165. дои : 10.1016/0169-7439(90)80131-О . ISSN 0169-7439 . Викиданные Q99233812 .
- ^ Кристоф Стейнбек (20 сентября 1996 г.). «LUCY — программа для выяснения структуры на основе корреляционных экспериментов ЯМР». Angewandte Chemie, международное издание . 35 (17): 1984–1986. дои : 10.1002/ANIE.199619841 . ISSN 1433-7851 . Викиданные Q50368945 .
- ^ Кристоф Стейнбек (ноябрь 2001 г.). «SENECA: независимая от платформы, распределенная и параллельная система для компьютерного определения структуры в органической химии». Журнал химической информации и компьютерных наук (на английском и английском языках). 41 (6): 1500–1507. дои : 10.1021/CI000407N . ISSN 1520-5142 . ПМИД 11749575 . Викиданные Q28837910 .
- ^ Жан-Лу Фаулон (январь 1996 г.). «Стохастический генератор химической структуры. 2. Использование моделирования отжига для поиска в пространстве конституционных изомеров». Журнал химической информации и компьютерных наук . 36 (4): 731–740. дои : 10.1021/CI950179A . ISSN 1520-5142 . Викиданные Q28837961 .
- ^ Жан-Марк Нузийяр; Массио Жорж (январь 1991 г.). «Логика определения структуры». Тетраэдр . 47 (22): 3655–3664. дои : 10.1016/S0040-4020(01)80878-4 . ISSN 0040-4020 . Викиданные Q57818172 .
- ^ К.А. Блинов; М.Э. Эльяшберг; С.Г. Молодцов; Эй Джей Уильямс; Э. Р. Мартиросян (1 апреля 2001 г.). «Экспертная система для автоматического определения структуры с использованием корреляций 1H-1H, 13C-1H и 15N-1H 2D ЯМР». Журнал аналитической химии Фрезениуса . 369 (7–8): 709–714. дои : 10.1007/S002160100757 . ISSN 0937-0633 . ПМИД 11371077 . Викиданные Q43616194 .
- ^ Йохен Юнкер (28 июля 2011 г.). «Обсуждение структуры на основе теоретических корреляций ЯМР» . Журнал хеминформатики . 3 (1): 27. дои : 10.1186/1758-2946-3-27 . ISSN 1758-2946 . ПМК 3162559 . ПМИД 21797997 . Викиданные Q38264559 .
- ^ Чанг-Ю Ху; Лу Сюй (ноябрь 1994 г.). «Принципы построения структуры органических изомеров по молекулярной формуле». Аналитика Химика Акта . 298 (1): 75–85. дои : 10.1016/0003-2670(94)90044-2 . ISSN 0003-2670 . Викиданные Q99233968 .
- ^ Цзюньфэн Хао; Лу Сюй; Чангю Ху (октябрь 2000 г.). «Экспертная система определения структуры органических соединений (ESESOC)». Наука в Китае. Серия Б: Химия . 43 (5): 503–515. дои : 10.1007/BF02969496 . ISSN 1006-9291 . Викиданные, первый квартал
- ^ Жан-Лу Фаулон (1 сентября 1994 г.). «Стохастический генератор химической структуры. 1. Приложение к выяснению структуры больших молекул». Журнал химической информации и компьютерных наук . 34 (5): 1204–1218. дои : 10.1021/CI00021A031 . ISSN 1520-5142 . Викиданные Q99233862 .
- ^ Жан-Лу Фаулон; Карла Дж. Черчвелл; Дональд П. Виско (1 мая 2003 г.). «Сигнатурный молекулярный дескриптор. 2. Подсчет молекул по их расширенным валентным последовательностям». Журнал химической информации и компьютерных наук . 43 (3): 721–734. дои : 10.1021/CI020346O . ISSN 1520-5142 . ПМИД 12767130 . Викиданные Q52016182 .
- ^ Хулио Э. Пейронсели; Мигель Рохас-Черто; Давиде Фичера; Тео Реймерс; Леон Кулиер; Жан-Лу Фаулон; Томас Ханкемайер (17 сентября 2012 г.). «OMG: Генератор открытых молекул» . Журнал хеминформатики . 4 (1): 21. дои : 10.1186/1758-2946-4-21 . ISSN 1758-2946 . ПМЦ 3558358 . ПМИД 22985496 . Викиданные Q27499209 .
- ^ Жан Лу Фаулон (1 июля 1992 г.). «Об использовании граф-эквивалентных классов для выяснения структуры больших молекул». Журнал химической информации и компьютерных наук . 32 (4): 338–348. дои : 10.1021/CI00008A013 . ISSN 1520-5142 . Викиданные Q99233853 .
- ^ Брендан Д. Маккей ; Адольфо Пиперно (январь 2014 г.). «Практический изоморфизм графов, II». Журнал символических вычислений . 60 : 94–112. дои : 10.1016/J.JSC.2013.09.003 . ISSN 0747-7171 . Збл 1394.05079 . Викиданные Q99301767 .
- ^ Йирик, Массачусетс (2020). «Эталон для генераторов структур» – через Blogger.
- ^ Мохаммад Махди Джагури; Сунг-Шик Т.К. Джонгманс; Фрэнк Фермер; Хулио Пейронсели; Жан-Лу Фаулон; Тео Реймерс; Томас Ханкемайер (декабрь 2013 г.). «PMG: Многоядерная идентификация метаболитов». Электронные заметки по теоретической информатике . 299 : 53–60. дои : 10.1016/J.ENTCS.2013.11.005 . ISSN 1571-0661 . Викиданные Q105032974 .
- ^ М.С. Молчанова; В.В. Щербухин; Н.С. Зефиров (январь 1996 г.). «Компьютерная генерация молекулярных структур по программе SMOG». Журнал химической информации и компьютерных наук . 36 (4): 888–899. дои : 10.1021/CI950393Z . ISSN 1520-5142 . Викиданные Q99233768 .
- ^ ИП Бангов; К.Д. Канев (февраль 1988 г.). «Компьютерное генерирование структуры по общей формуле: II. Ненасыщенные и циклические соединения с кратными связями. Использование фрагментов». Журнал математической химии . 2 (1): 31–48. дои : 10.1007/BF01166467 . ISSN 0259-9791 . Викиданные Q105033085 .
- ^ Кербер, А; Лауэ, Р; Мерингер, М; Вармуза, К. (2001). «МОЛГЕН-МС: Оценка масс-спектров электронного удара низкого разрешения с МС-классификацией и исчерпывающей генерацией структуры» . Достижения в масс-спектрометрии . стр. 939–940.
- ^ Томоюки Мияо; Хиромаса Канеко; Кимито Фунацу (14 июня 2016 г.). «Генерация химических графов на основе кольцевой системы для молекулярного дизайна de novo». Журнал компьютерного молекулярного дизайна . 30 (5): 425–446. дои : 10.1007/S10822-016-9916-1 . ISSN 0920-654X . ПМИД 27299746 . Викиданные Q50627884 .
- ^ Томоюки Мияо; Хиромаса Канеко; Кимито Фунацу (26 ноября 2014 г.). «Генерация исчерпывающей структуры на основе кольцевой системы для обратного QSPR/QSAR». Молекулярная информатика . 33 (11–12): 764–778. дои : 10.1002/MINF.201400072 . ISSN 1868-1743 . ПМИД 27485423 . Викиданные Q39092888 .
- ^ Томоюки Мияо; Масамото Аракава; Кимито Фунацу (1 января 2010 г.). «Генерация исчерпывающей структуры для обратного QSPR/QSAR». Молекулярная информатика . 29 (1–2): 111–125. дои : 10.1002/MINF.200900038 . ISSN 1868-1743 . ПМИД 27463853 . Викиданные Q51758769 .
- ^ Бодуэн Делепин; Томас Дуигу; Пол Карбонелл; Жан-Лу Фаулон (9 декабря 2017 г.). «RetroPath2.0: Рабочий процесс ретросинтеза для инженеров-метаболистов». Метаболическая инженерия . 45 : 158–170. дои : 10.1016/j.ymben.2017.12.002 . ISSN 1096-7176 . ПМИД 29233745 . Викиданные, четвертый квартал
- ^ Матильда Кох; Томас Дуигу; Пабло Карбонелл; Жан-Лу Фаулон (19 декабря 2017 г.). «Подсчет молекулярных структур и виртуальный скрининг в химическом пространстве с помощью RetroPath2.0» . Журнал хеминформатики . 9 (1): 64. дои : 10.1186/S13321-017-0252-9 . ISSN 1758-2946 . ПМК 5736515 . ПМИД 29260340 . Викиданные Q47199780 .
- ^ Артур Кадурин; Сергей Николенко; Кузьма Храбров; Алекс Алипер; Алексей Жаворонков (13 июля 2017 г.). «druGAN: усовершенствованная генеративно-состязательная модель автоэнкодера для нового поколения новых молекул с желаемыми молекулярными свойствами в кремнии». Молекулярная фармацевтика . 14 (9): 3098–3104. doi : 10.1021/ACS.MOLPHARMACEUT.7B00346 . ISSN 1543-8384 . ПМИД 28703000 . Викиданные Q38681438 .
- ^ Томас Блашке; Маркус Оливекрона; Ола Энгквист; Юрген Байорат; Хунмин Чен (13 декабря 2017 г.). «Применение генеративного автоэнкодера в молекулярном дизайне Ново» . Молекулярная информатика . 37 (1–2): 1700123. arXiv : 1711.07839 . дои : 10.1002/MINF.201700123 . ISSN 1868-1743 . ПМК 5836887 . ПМИД 29235269 . Викиданные Q48127458 .
- ^ Кристи Б.Д.; Мунк М.Е. (1 мая 1988 г.). «Генерация структур путем сокращения: новая стратегия компьютерного объяснения структуры». Журнал химической информации и компьютерных наук . 28 (2): 87–93. дои : 10.1021/CI00058A009 . ISSN 1520-5142 . ПМИД 3392122 . Викиданные Q38594392 .
- ^ Роберт С. Глем; Андреас Бендер; Кэтрин Х. Арнби; Ларс Карлссон; Скотт Бойер; Джеймс Смит (1 марта 2006 г.). «Круговые отпечатки пальцев: гибкие молекулярные дескрипторы с приложениями от физической химии до ADME». IDrugs: журнал по исследованию лекарственных средств . 9 (3): 199–204. ISSN 1369-7056 . ПМИД 16523386 . Викиданные Q51947334 .
- ^ Жан-Лу Фаулон; Майкл Дж. Коллинз; Роберт Д. Карр (1 марта 2004 г.). «Сигнатурный молекулярный дескриптор. 4. Канонизация молекул с использованием расширенных валентных последовательностей». Журнал химической информации и компьютерных наук . 44 (2): 427–436. дои : 10.1021/CI0341823 . ISSN 1520-5142 . ПМИД 15032522 . Викиданные Q45023689 .
- ^ Симона Боханец (1 мая 1995 г.). «Создание структуры путем сочетания уменьшения структуры и сборки структуры». Журнал химической информации и компьютерных наук . 35 (3): 494–503. дои : 10.1021/CI00025A017 . ISSN 1520-5142 . Викиданные Q99233866 .
- ^ А. Корытько; КП Шульц; М. С. Мэдисон; Мунк М.Е. (1 сентября 2003 г.). «HOUDINI: новый подход к компьютерной генерации структур» . Журнал химической информации и компьютерных наук . 43 (5): 1434–1446. дои : 10.1021/CI034057R . ISSN 1520-5142 . ПМИД 14502476 . Викиданные Q52009004 .
- ^ Г. Массио; Дж. М. Нузиллард (июль 1992 г.). «Компьютерное определение структуры натуральных продуктов». Фитохимический анализ . 3 (4): 153–159. дои : 10.1002/PCA.2800030403 . ISSN 0958-0344 . Викиданные Q57818162 .
- ^ Дональд Лоусон Креер; Дуглас Р. Стинсон (март 1999 г.). «Комбинаторные алгоритмы: генерация, перебор и поиск». Новости ACM SIGACT . 30 (1): 33–35. дои : 10.1145/309739.309744 . ISSN 0163-5700 . Викиданные Q105033277 .
- ^ Стивен Р. Хеллер; Алан Макнот; Игорь Плетнев; Стивен Стейн; Дмитрий Чеховской (2015). «InChI, Международный химический идентификатор ИЮПАК» . Журнал хеминформатики . 7 (1): 23. дои : 10.1186/S13321-015-0068-4 . ISSN 1758-2946 . ПМК 4486400 . ПМИД 26136848 . Викиданные Q21146620 .
- ^ Хесам Дашти; Уильям М. Вестлер; Джон Л. Маркли ; Хамид Р. Эгбалния (23 мая 2017 г.). «Уникальные идентификаторы малых молекул позволяют точно маркировать их атомы» . Научные данные . 4 : 170073. дои : 10.1038/SDATA.2017.73 . ISSN 2052-4463 . ПМЦ 5441290 . ПМИД 28534867 . Викиданные Q33718167 .
- ^ Йирик, Мехмет Азиз; Сорокина, Мария; Стейнбек, Кристоф (декабрь 2021 г.). «MAYGEN: генератор химической структуры с открытым исходным кодом для конституционных изомеров, основанный на принципе упорядоченной генерации» . Журнал хеминформатики . 13 (1): 48. дои : 10.1186/s13321-021-00529-9 . ПМЦ 8254276 . ПМИД 34217353 .
- ^ Маккей, Брендан Д.; Йирик, Мехмет Азиз; Стейнбек, Кристоф (декабрь 2022 г.). «Surge: быстрый генератор химических графов с открытым исходным кодом» . Журнал хеминформатики . 14 (1): 24. дои : 10.1186/s13321-022-00604-9 . ПМК 9034616 . ПМИД 35461261 .
Внешние ссылки
[ редактировать ]СМИ, связанные с химическими графиками, на Викискладе?