Jump to content

Произвольная целевая спецификация SMILES

Спецификация произвольной цели SMILES (SMARTS) — это язык для определения субструктурных паттернов в молекулах . SMARTS Обозначение строк является выразительным и позволяет чрезвычайно точно и прозрачно определять подструктуры и типизировать атомы.

SMARTS связан с линейным обозначением SMILES , которое используется для кодирования молекулярных структур, и, как и SMILES, изначально был разработан Дэвидом Вейнингером и его коллегами из Daylight Chemical Information Systems. Наиболее полное описание языка SMARTS можно найти в руководстве по теории SMARTS от Daylight. [1] учебник [2] и примеры. [3] OpenEye Scientific Software разработала собственную версию SMARTS, которая отличается от оригинальной версии Daylight тем, как R дескриптор (см. цикличность ниже).

Синтаксис SMARTS

[ редактировать ]

Атомные свойства

[ редактировать ]

Атомы могут быть указаны символом или атомным номером. Алифатическому углероду соответствует [C], ароматический углерод [c] и любой углерод [#6] или [C,c]. Символы дикой карты *, A и a соответствовать любому атому, любому алифатическому атому и любому ароматическому атому соответственно. Неявные атомы водорода считаются характеристикой атомов, а SMARTS для аминогруппы можно записать как [NH2]. Заряд указывается дескрипторами + и - на примере СМАРТС [nH+] (протонированный ароматический атом азота) и [O-]C(=O)c (депротонированная ароматическая карбоновая кислота ).

Облигации

[ редактировать ]

Можно указать несколько типов облигаций: - (одинокий), = (двойной), # (тройной), : (ароматический) и ~ (любой).

Возможности подключения

[ редактировать ]

The X и D дескрипторы используются для указания общего количества соединений (включая неявные атомы водорода) и соединений с явными атомами. Таким образом [CX4] сопоставляет атомы углерода со связями с любыми четырьмя другими атомами, в то время как [CD4] соответствует четвертичному углероду.

Цикличность

[ редактировать ]

Согласно первоначальному определению Daylight, R Дескриптор используется для указания членства в кольце. В модели Дневного света для циклических систем наименьший набор наименьших колец (СССР) [4] используется в качестве основы для членства в кольце. Например, индол воспринимается как 5-членное кольцо, слитое с 6-членным, а не как 9-членное кольцо. Два атома углерода, образующие кольцо, будут совпадать. [cR2] и другие атомы углерода будут соответствовать [cR1].

Модель СССР подверглась критике со стороны OpenEye [5] которые при внедрении СМАРТС используют R для обозначения количества кольцевых связей атома. Два атома углерода в слиянии колец совпадают. [cR3] и остальные атомы углерода совпадают [cR2] в реализации SMARTS OpenEye. Используется без номера, R указывает атом в кольце в обеих реализациях, например [CR] (алифатический атом углерода в кольце).

Нижний регистр r определяет размер наименьшего кольца, членом которого является атом. Атомы углерода в слиянии колец будут совпадать. [cr5]. Облигации можно указать как циклические, например C@C соответствует непосредственно связанным атомам в кольце.

Логические операторы

[ редактировать ]

Четыре логических оператора позволяют комбинировать дескрипторы атома и связи. Оператор «и» ; можно использовать для определения протонированного первичного амина как [N;H3;+][C;X4]. Оператор «или» , имеет более высокий приоритет, поэтому [c,n;H] определяет (ароматический углерод или ароматический азот) с неявным водородом. Оператор «и» & имеет более высокий приоритет, чем , так [c,n&H] определяет ароматический углерод или (ароматический азот с неявным водородом).

Оператор «не» ! можно использовать для определения ненасыщенного алифатического углерода как [C;!X4] и ациклические связи, как *-!@*.

Рекурсивный SMARTS

[ редактировать ]

Рекурсивные SMARTS позволяют подробно описать окружение атома. Например, более реакционноспособные (по отношению к электрофильному ароматическому замещению ) орто- и параатомы углерода фенола можно определить как [$(c1c([OH])cccc1),$(c1ccc([OH])cc1)].

Примеры СМАРТС

[ редактировать ]

Ряд наглядных примеров SMARTS был собран Daylight.

Определения доноров и акцепторов водородных связей, используемые для применения правила пяти Липински. [6] легко кодируются в SMARTS. Доноры определяются как атомы азота или кислорода, которые имеют хотя бы один непосредственно связанный атом водорода:

[N,n,O;!H0] или [#7,#8;!H0] (ароматический кислород не может иметь связанный водород)

Акцепторы определяются как азот или кислород:

[N,n,O,o] или [#7,#8]

Простое определение алифатических аминов , которые могут протонировать при физиологическом pH, можно записать в виде следующего рекурсивного SMARTS:

[$([NH2][CX4]),$([NH]([CX4])[CX4]),$([NX3]([CX4])([CX4])[CX4])]

В реальных приложениях CX4 атомы должны быть определены более точно, чтобы предотвратить сопоставление с электроноакцепторными группами, такими как CF 3 , которые сделают амин недостаточно основным для протонирования при физиологическом pH .

SMARTS можно использовать для кодирования фармакофорных элементов, таких как анионные центры. В следующем примере рекурсивная нотация SMARTS используется для объединения кислотного кислорода и тетразольного азота в определении атомов кислорода, которые могут быть анионными при нормальных физиологических условиях.

[$([OH][C,S,P]=O),$([nH]1nnnc1)]

SMARTS, приведенный выше, будет соответствовать только кислотному гидроксилу и тетразолу N-H. Когда карбоновая кислота депротонирует, отрицательный заряд делокализуется по обоим атомам кислорода, и может быть желательно обозначить оба атома как анионные. Этого можно добиться с помощью следующих SMARTS.

[$([OH])C=O),$(O=C[OH])]

Приложения СМАРТС

[ редактировать ]

Точная и прозрачная спецификация подструктур, обеспечиваемая SMARTS, использовалась в ряде приложений.

Использовались подструктурные фильтры, определенные в SMARTS. [7] для выявления нежелательных соединений при выполнении стратегического объединения соединений для высокопроизводительного скрининга. REOS (быстрое устранение помоев) [8] Процедура использует SMARTS для фильтрации реактивных, токсичных и других нежелательных фрагментов из баз данных химических структур.

РЕЗЮМЕ [9] (Процедура ретросинтетического комбинаторного анализа) использует SMARTS для определения типов связей. RECAP — это редактор молекул , который генерирует фрагменты структур путем разрыва связей определенных типов, а исходные точки связи в них указываются с использованием изотопных меток. Поиск в базах данных биологически активных соединений на предмет встречаемости фрагментов позволяет идентифицировать привилегированные структурные мотивы. Молекулярный слайсер [10] аналогичен RECAP и используется для идентификации фрагментов, которые обычно встречаются в продаваемых пероральных препаратах.

Программа «Кожаное лицо» [11] это редактор молекул общего назначения , который позволяет автоматически изменять ряд субструктурных особенностей молекул в базах данных, включая состояние протонирования, количество водорода, формальный заряд, изотопный вес и порядок связей. Правила молекулярного редактирования, используемые Leatherface, определены в SMARTS. Leatherface можно использовать для стандартизации таутомерных и ионизационных состояний, а также для их установки и перечисления при подготовке баз данных. [12] на виртуальный просмотр . Leatherface использовался в анализе подобранных молекулярных пар , который позволяет количественно оценить эффекты структурных изменений (например, замену водорода хлором). [13] по целому ряду структурных типов.

АЛАДДИН [14] представляет собой программу сопоставления фармакофоров , которая использует SMARTS для определения точек распознавания (например, нейтрального акцептора водородной связи ) фармакофоров. Ключевая проблема подбора фармакофоров заключается в том, что функциональные группы, которые могут быть ионизированы при физиологическом pH, обычно регистрируются в своих нейтральных формах в структурных базах данных. Программа сопоставления форм ROCS позволяет определять типы атомов с помощью SMARTS. [15]

Примечания и ссылки

[ редактировать ]
  1. ^ Руководство по теории SMARTS , Химические информационные системы дневного света, Санта-Фе, Нью-Мексико
  2. ^ Учебное пособие по SMARTS , Химические информационные системы дневного света, Санта-Фе, Нью-Мексико.
  3. ^ Примеры SMARTS , Химические информационные системы дневного света, Санта-Фе, Нью-Мексико.
  4. ^ Даунс, генеральный менеджер; Жилле, виджей; Холлидей, Джей Ди; Линч, МФ (1989). «Обзор алгоритмов восприятия колец для химических графов». Дж. Хим. Инф. Вычислить. наук. 29 (3): 172–187. дои : 10.1021/ci00063a007 .
  5. ^ «Набор наименьших колец (СССР) считается вредным» . Архивировано из оригинала 14 октября 2007 года . Проверено 8 февраля 2017 г. {{cite web}}: CS1 maint: bot: статус исходного URL-адреса неизвестен ( ссылка ) , OEChem — Руководство по C++, версия 1.5.1, OpenEye Scientific Software, Санта-Фе, Нью-Мексико
  6. ^ Липински, Кристофер А.; Ломбардо, Франко; Домини, Берил В.; Фини, Пол Дж. (2001). «Экспериментальные и вычислительные подходы к оценке растворимости и проницаемости при открытии и разработке лекарств». Обзоры расширенной доставки лекарств . 46 (1–3): 3–26. дои : 10.1016/S0169-409X(00)00129-0 . ПМИД   11259830 .
  7. ^ Ханн, Майк; Хадсон, Брайан; Льюэлл, Сяо; Лайфли, Роб; Миллер, Люк; Рамсден, Найджел (1999). «Стратегическое объединение соединений для высокопроизводительного скрининга». Журнал химической информации и компьютерных наук . 39 (5): 897–902. дои : 10.1021/ci990423o . ПМИД   10529988 .
  8. ^ Уолтерс, В.Патрик; Мурко, Марк А. (2002). «Прогнозирование «подобия наркотикам» ». Обзоры расширенной доставки лекарств . 54 (3): 255–271. дои : 10.1016/S0169-409X(02)00003-0 . ПМИД   11922947 .
  9. ^ Льюэлл, Сяо Цин; Джадд, Дункан Б.; Уотсон, Стивен П.; Ханн, Майкл М. (1998). «Процедура комбинаторного анализа RECARetrosynthetic: мощный новый метод идентификации привилегированных молекулярных фрагментов с полезными применениями в комбинаторной химии». Журнал химической информации и компьютерных наук . 38 (3): 511–522. дои : 10.1021/ci970429i . ПМИД   9611787 .
  10. ^ Вит, Михал; Сигел, Майлз Г.; Хиггс, Ричард Э.; Уотсон, Ян А.; Робертсон, Дэниел Х.; Савин, Кеннет А.; Дерст, Грегори Л.; Хипскинд, Филип А. (2004). «Характерные физические свойства и структурные фрагменты поступающих в продажу пероральных препаратов». Журнал медицинской химии . 47 (1): 224–232. дои : 10.1021/jm030267j . ПМИД   14695836 .
  11. ^ Кенни, Питер В.; Садовский, Йенс (2005). «Модификация структуры в химических базах данных». Хемоинформатика в открытии лекарств . Методы и принципы медицинской химии. стр. 271–285 . дои : 10.1002/3527603743.ch11 . ISBN  9783527307531 .
  12. ^ Лайн, Пол Д.; Кенни, Питер В.; Косгроув, Дэвид А.; Дэн, Чун; Заблудова, Соня; Вендолоски, Джон Дж.; Эшвелл, Сьюзен (2004). «Идентификация соединений с наномолярным сродством связывания с контрольной точкой киназы-1 с использованием виртуального скрининга, основанного на знаниях». Журнал медицинской химии . 47 (8): 1962–1968. дои : 10.1021/jm030504i . ПМИД   15055996 .
  13. ^ Лич, Эндрю Г.; Джонс, Хью Д.; Косгроув, Дэвид А.; Кенни, Питер В.; Растон, Линетт; Макфол, Филип; Вуд, Дж. Мэтью; Колклаф, Никола; Закон, Брайан (2006). «Соответствующие молекулярные пары как руководство по оптимизации фармацевтических свойств; исследование растворимости в воде, связывания с белками плазмы и перорального воздействия». Журнал медицинской химии . 49 (23): 6672–6682. дои : 10.1021/jm0605233 . ПМИД   17154498 .
  14. ^ Ван Дри, Джон Х.; Вейнингер, Дэвид; Мартин, Ивонн К. (1989). «АЛАДДИН: интегрированный инструмент для компьютерного молекулярного дизайна и распознавания фармакофоров на основе геометрического, стерического и субструктурного поиска трехмерных молекулярных структур». Журнал компьютерного молекулярного дизайна . 3 (3): 225–251. дои : 10.1007/BF01533070 . ПМИД   2573695 . S2CID   206795998 .
  15. ^ Научное программное обеспечение OpenEye | РОКС
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 718f694cb43b3c2c0d87c504a8b285f1__1713150180
URL1:https://arc.ask3.ru/arc/aa/71/f1/718f694cb43b3c2c0d87c504a8b285f1.html
Заголовок, (Title) документа по адресу, URL1:
SMILES arbitrary target specification - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)