Произвольная целевая спецификация SMILES
Спецификация произвольной цели SMILES (SMARTS) — это язык для определения субструктурных паттернов в молекулах . SMARTS Обозначение строк является выразительным и позволяет чрезвычайно точно и прозрачно определять подструктуры и типизировать атомы.
SMARTS связан с линейным обозначением SMILES , которое используется для кодирования молекулярных структур, и, как и SMILES, изначально был разработан Дэвидом Вейнингером и его коллегами из Daylight Chemical Information Systems. Наиболее полное описание языка SMARTS можно найти в руководстве по теории SMARTS от Daylight. [1] учебник [2] и примеры. [3] OpenEye Scientific Software разработала собственную версию SMARTS, которая отличается от оригинальной версии Daylight тем, как R
дескриптор (см. цикличность ниже).
Синтаксис SMARTS
[ редактировать ]Атомные свойства
[ редактировать ]Атомы могут быть указаны символом или атомным номером. Алифатическому углероду соответствует [C]
, ароматический углерод [c]
и любой углерод [#6]
или [C,c]
. Символы дикой карты *
, A
и a
соответствовать любому атому, любому алифатическому атому и любому ароматическому атому соответственно. Неявные атомы водорода считаются характеристикой атомов, а SMARTS для аминогруппы можно записать как [NH2]
. Заряд указывается дескрипторами +
и -
на примере СМАРТС [nH+]
(протонированный ароматический атом азота) и [O-]C(=O)c
(депротонированная ароматическая карбоновая кислота ).
Облигации
[ редактировать ]Можно указать несколько типов облигаций: -
(одинокий), =
(двойной), #
(тройной), :
(ароматический) и ~
(любой).
Возможности подключения
[ редактировать ]The X
и D
дескрипторы используются для указания общего количества соединений (включая неявные атомы водорода) и соединений с явными атомами. Таким образом [CX4]
сопоставляет атомы углерода со связями с любыми четырьмя другими атомами, в то время как [CD4]
соответствует четвертичному углероду.
Цикличность
[ редактировать ]Согласно первоначальному определению Daylight, R
Дескриптор используется для указания членства в кольце. В модели Дневного света для циклических систем наименьший набор наименьших колец (СССР) [4] используется в качестве основы для членства в кольце. Например, индол воспринимается как 5-членное кольцо, слитое с 6-членным, а не как 9-членное кольцо. Два атома углерода, образующие кольцо, будут совпадать. [cR2]
и другие атомы углерода будут соответствовать [cR1]
.
Модель СССР подверглась критике со стороны OpenEye [5] которые при внедрении СМАРТС используют R
для обозначения количества кольцевых связей атома. Два атома углерода в слиянии колец совпадают. [cR3]
и остальные атомы углерода совпадают [cR2]
в реализации SMARTS OpenEye. Используется без номера, R
указывает атом в кольце в обеих реализациях, например [CR]
(алифатический атом углерода в кольце).
Нижний регистр r
определяет размер наименьшего кольца, членом которого является атом. Атомы углерода в слиянии колец будут совпадать. [cr5]
. Облигации можно указать как циклические, например C@C
соответствует непосредственно связанным атомам в кольце.
Логические операторы
[ редактировать ]Четыре логических оператора позволяют комбинировать дескрипторы атома и связи. Оператор «и» ;
можно использовать для определения протонированного первичного амина как [N;H3;+][C;X4]
. Оператор «или» ,
имеет более высокий приоритет, поэтому [c,n;H]
определяет (ароматический углерод или ароматический азот) с неявным водородом. Оператор «и» &
имеет более высокий приоритет, чем ,
так [c,n&H]
определяет ароматический углерод или (ароматический азот с неявным водородом).
Оператор «не» !
можно использовать для определения ненасыщенного алифатического углерода как [C;!X4]
и ациклические связи, как *-!@*
.
Рекурсивный SMARTS
[ редактировать ]Рекурсивные SMARTS позволяют подробно описать окружение атома. Например, более реакционноспособные (по отношению к электрофильному ароматическому замещению ) орто- и параатомы углерода фенола можно определить как [$(c1c([OH])cccc1),$(c1ccc([OH])cc1)]
.
Примеры СМАРТС
[ редактировать ]Ряд наглядных примеров SMARTS был собран Daylight.
Определения доноров и акцепторов водородных связей, используемые для применения правила пяти Липински. [6] легко кодируются в SMARTS. Доноры определяются как атомы азота или кислорода, которые имеют хотя бы один непосредственно связанный атом водорода:
[N,n,O;!H0]
или[#7,#8;!H0]
(ароматический кислород не может иметь связанный водород)
Акцепторы определяются как азот или кислород:
[N,n,O,o]
или[#7,#8]
Простое определение алифатических аминов , которые могут протонировать при физиологическом pH, можно записать в виде следующего рекурсивного SMARTS:
[$([NH2][CX4]),$([NH]([CX4])[CX4]),$([NX3]([CX4])([CX4])[CX4])]
В реальных приложениях CX4
атомы должны быть определены более точно, чтобы предотвратить сопоставление с электроноакцепторными группами, такими как CF 3 , которые сделают амин недостаточно основным для протонирования при физиологическом pH .
SMARTS можно использовать для кодирования фармакофорных элементов, таких как анионные центры. В следующем примере рекурсивная нотация SMARTS используется для объединения кислотного кислорода и тетразольного азота в определении атомов кислорода, которые могут быть анионными при нормальных физиологических условиях.
[$([OH][C,S,P]=O),$([nH]1nnnc1)]
SMARTS, приведенный выше, будет соответствовать только кислотному гидроксилу и тетразолу N-H. Когда карбоновая кислота депротонирует, отрицательный заряд делокализуется по обоим атомам кислорода, и может быть желательно обозначить оба атома как анионные. Этого можно добиться с помощью следующих SMARTS.
[$([OH])C=O),$(O=C[OH])]
Приложения СМАРТС
[ редактировать ]Точная и прозрачная спецификация подструктур, обеспечиваемая SMARTS, использовалась в ряде приложений.
Использовались подструктурные фильтры, определенные в SMARTS. [7] для выявления нежелательных соединений при выполнении стратегического объединения соединений для высокопроизводительного скрининга. REOS (быстрое устранение помоев) [8] Процедура использует SMARTS для фильтрации реактивных, токсичных и других нежелательных фрагментов из баз данных химических структур.
РЕЗЮМЕ [9] (Процедура ретросинтетического комбинаторного анализа) использует SMARTS для определения типов связей. RECAP — это редактор молекул , который генерирует фрагменты структур путем разрыва связей определенных типов, а исходные точки связи в них указываются с использованием изотопных меток. Поиск в базах данных биологически активных соединений на предмет встречаемости фрагментов позволяет идентифицировать привилегированные структурные мотивы. Молекулярный слайсер [10] аналогичен RECAP и используется для идентификации фрагментов, которые обычно встречаются в продаваемых пероральных препаратах.
Программа «Кожаное лицо» [11] это редактор молекул общего назначения , который позволяет автоматически изменять ряд субструктурных особенностей молекул в базах данных, включая состояние протонирования, количество водорода, формальный заряд, изотопный вес и порядок связей. Правила молекулярного редактирования, используемые Leatherface, определены в SMARTS. Leatherface можно использовать для стандартизации таутомерных и ионизационных состояний, а также для их установки и перечисления при подготовке баз данных. [12] на виртуальный просмотр . Leatherface использовался в анализе подобранных молекулярных пар , который позволяет количественно оценить эффекты структурных изменений (например, замену водорода хлором). [13] по целому ряду структурных типов.
АЛАДДИН [14] представляет собой программу сопоставления фармакофоров , которая использует SMARTS для определения точек распознавания (например, нейтрального акцептора водородной связи ) фармакофоров. Ключевая проблема подбора фармакофоров заключается в том, что функциональные группы, которые могут быть ионизированы при физиологическом pH, обычно регистрируются в своих нейтральных формах в структурных базах данных. Программа сопоставления форм ROCS позволяет определять типы атомов с помощью SMARTS. [15]
Примечания и ссылки
[ редактировать ]- ^ Руководство по теории SMARTS , Химические информационные системы дневного света, Санта-Фе, Нью-Мексико
- ^ Учебное пособие по SMARTS , Химические информационные системы дневного света, Санта-Фе, Нью-Мексико.
- ^ Примеры SMARTS , Химические информационные системы дневного света, Санта-Фе, Нью-Мексико.
- ^ Даунс, генеральный менеджер; Жилле, виджей; Холлидей, Джей Ди; Линч, МФ (1989). «Обзор алгоритмов восприятия колец для химических графов». Дж. Хим. Инф. Вычислить. наук. 29 (3): 172–187. дои : 10.1021/ci00063a007 .
- ^ «Набор наименьших колец (СССР) считается вредным» . Архивировано из оригинала 14 октября 2007 года . Проверено 8 февраля 2017 г.
{{cite web}}
: CS1 maint: bot: статус исходного URL-адреса неизвестен ( ссылка ) , OEChem — Руководство по C++, версия 1.5.1, OpenEye Scientific Software, Санта-Фе, Нью-Мексико - ^ Липински, Кристофер А.; Ломбардо, Франко; Домини, Берил В.; Фини, Пол Дж. (2001). «Экспериментальные и вычислительные подходы к оценке растворимости и проницаемости при открытии и разработке лекарств». Обзоры расширенной доставки лекарств . 46 (1–3): 3–26. дои : 10.1016/S0169-409X(00)00129-0 . ПМИД 11259830 .
- ^ Ханн, Майк; Хадсон, Брайан; Льюэлл, Сяо; Лайфли, Роб; Миллер, Люк; Рамсден, Найджел (1999). «Стратегическое объединение соединений для высокопроизводительного скрининга». Журнал химической информации и компьютерных наук . 39 (5): 897–902. дои : 10.1021/ci990423o . ПМИД 10529988 .
- ^ Уолтерс, В.Патрик; Мурко, Марк А. (2002). «Прогнозирование «подобия наркотикам» ». Обзоры расширенной доставки лекарств . 54 (3): 255–271. дои : 10.1016/S0169-409X(02)00003-0 . ПМИД 11922947 .
- ^ Льюэлл, Сяо Цин; Джадд, Дункан Б.; Уотсон, Стивен П.; Ханн, Майкл М. (1998). «Процедура комбинаторного анализа RECARetrosynthetic: мощный новый метод идентификации привилегированных молекулярных фрагментов с полезными применениями в комбинаторной химии». Журнал химической информации и компьютерных наук . 38 (3): 511–522. дои : 10.1021/ci970429i . ПМИД 9611787 .
- ^ Вит, Михал; Сигел, Майлз Г.; Хиггс, Ричард Э.; Уотсон, Ян А.; Робертсон, Дэниел Х.; Савин, Кеннет А.; Дерст, Грегори Л.; Хипскинд, Филип А. (2004). «Характерные физические свойства и структурные фрагменты поступающих в продажу пероральных препаратов». Журнал медицинской химии . 47 (1): 224–232. дои : 10.1021/jm030267j . ПМИД 14695836 .
- ^ Кенни, Питер В.; Садовский, Йенс (2005). «Модификация структуры в химических базах данных». Хемоинформатика в открытии лекарств . Методы и принципы медицинской химии. стр. 271–285 . дои : 10.1002/3527603743.ch11 . ISBN 9783527307531 .
- ^ Лайн, Пол Д.; Кенни, Питер В.; Косгроув, Дэвид А.; Дэн, Чун; Заблудова, Соня; Вендолоски, Джон Дж.; Эшвелл, Сьюзен (2004). «Идентификация соединений с наномолярным сродством связывания с контрольной точкой киназы-1 с использованием виртуального скрининга, основанного на знаниях». Журнал медицинской химии . 47 (8): 1962–1968. дои : 10.1021/jm030504i . ПМИД 15055996 .
- ^ Лич, Эндрю Г.; Джонс, Хью Д.; Косгроув, Дэвид А.; Кенни, Питер В.; Растон, Линетт; Макфол, Филип; Вуд, Дж. Мэтью; Колклаф, Никола; Закон, Брайан (2006). «Соответствующие молекулярные пары как руководство по оптимизации фармацевтических свойств; исследование растворимости в воде, связывания с белками плазмы и перорального воздействия». Журнал медицинской химии . 49 (23): 6672–6682. дои : 10.1021/jm0605233 . ПМИД 17154498 .
- ^ Ван Дри, Джон Х.; Вейнингер, Дэвид; Мартин, Ивонн К. (1989). «АЛАДДИН: интегрированный инструмент для компьютерного молекулярного дизайна и распознавания фармакофоров на основе геометрического, стерического и субструктурного поиска трехмерных молекулярных структур». Журнал компьютерного молекулярного дизайна . 3 (3): 225–251. дои : 10.1007/BF01533070 . ПМИД 2573695 . S2CID 206795998 .
- ^ Научное программное обеспечение OpenEye | РОКС