Обозначение строки SYBYL
Расширение имени файла | .sln |
---|---|
Тип формата | химический формат файла |
Обозначение строки SYBYL или SLN — это спецификация для однозначного описания структуры химических молекул с использованием коротких ASCII строк . SLN отличается от SMILES по нескольким важным аспектам. SLN может определять молекулы, молекулярные запросы и реакции в однострочной записи, тогда как SMILES обрабатывает их посредством расширений языка. SLN поддерживает относительную стереохимию , он может отличать смеси энантиомеров от чистых молекул с чистой, но неразрешенной стереохимией. В SMILES ароматичность считается свойством как атомов, так и связей, тогда как в SLN она является свойством связей.
Описание
[ редактировать ]Как и SMILES, SLN — это линейный язык, описывающий молекулы. Это обеспечивает много общего с SMILES, несмотря на множество отличий SLN от SMILES, и в результате в этом описании SLN будет сильно сравниваться с SMILES и его расширениями.
Атрибуты
[ редактировать ]Атрибуты, строки в квадратных скобках с дополнительными данными, такими как [key1=value1, key2...]
, является основной функцией SLN. Атрибуты можно применять к атомам и связям. Атрибуты, не определенные официально, доступны пользователям для частных расширений.
При поиске молекул используются операторы сравнения, такие как fcharge>-0.125
может использоваться вместо обычного знака равенства. А !
предшествующая группе ключ/значение инвертирует результат сравнения.
Целые молекулы или реакции также могут иметь атрибуты. Квадратные скобки заменяются парой <>
знаки.
Атомы
[ редактировать ]Все, что начинается с заглавной буквы, идентифицирует атом в SLN. Водороды не добавляются автоматически, но одинарные связи с водородом можно сократить до органических соединений, в результате чего CH4
вместо C(H)(H)(H)H
для метана . Автор утверждает, что явные водороды обеспечивают более надежный анализ.
Атрибуты, определенные для атомов, включают в себя I=
для массового числа изотопа, charge=
за формальную плату, fcharge
за частичную оплату, s=
для стереохимии и spin=
для радикалов ( s
, d
, t
соответственно для синглета , дублета , триплета ). Официальное обвинение в charge=2
можно сократить как +2
и наоборот для отрицательных зарядов; -
и +
дополнительно признается как расходы −1 или +1. *
это сокращение от spin=d
. Стереохимия атомов в основном тетраэдрическая, с R
/ S
и D
/ L
доступен среди других; это может быть явно ( E
) или относительный ( R
), или укажите смесь ( M
) стереоизомеров по этому атому. Нормальный/перевернутый ( N
/ I
) обозначение, эквивалентное @@
и @
в SMILES предусмотрена. Для поиска предусмотрено множество дополнительных атрибутов.
Помимо элементарных атомов SLN поддерживает спецификацию атомов подстановочных знаков: Any
(соответствует любому атому) и Hev
(соответствует любому тяжелому атому). Он также имеет обширный синтаксис Маркуша для указания комбинаторных библиотек и запросов RGROUP. SLN имеет несколько типов атомов запроса для сопоставления групп атомов. Каждый тип имеет имя группы, за которым следует необязательное положительное целое число.
Группа Описание R
Используется для соответствия боковой цепи. Совпадающие атомы не должны иметь никакой связи с ядром. X
Используется для сочетания с боковыми цепочками и кольцами. Атомы, соответствующие X
группа может сочетать боковые цепи и кольцаRx
Соответствует боковым цепочкам и кольцам, застежка кольца должна соответствовать второй. Rx
группа
" 0
"массовое число обозначает обычный изотоп, поэтому N[I=0]
равно N[I=14]
соответствие 14 Н и N[!I=0]
соответствующий любому другому изотопу.
Облигации
[ редактировать ]SLN использует в основном те же обозначения связи, что и SMILES, с -
, =
, #
, и :
для одинарных, двойных, тройных и ароматических связей. .
используется для связей нулевого порядка, аналогично реакции УЛЫБКА, хотя +
предпочтителен для отдельных молекул.
Большинство одинарных связей являются неявными, поэтому CH3CH3
(CH 3 CH 3 ) можно использовать вместо CH3-CH3
(CH 3 –CH 3 ) для этана . Явные одинарные связи полезны для трехцентровых связей.
The s=
Атрибут определен для двойных связей, чтобы передать информацию о стереохимии в формате E – Z ( E
/ Z
) или цис - транс ( c
/ t
) обозначения. N
/ I
доступен и обозначает «основную» цепь, которая является транс- или цис- по отношению друг к другу.
Кольца
[ редактировать ]SLN записывает кольца по более явному шаблону, чем SMILES, где бензол обозначается как C[1]H:CH:CH:CH:CH:CH:@1
. Атом помечен как якорь на кольце с одним числовым атрибутом и @1
затем может быть использован для указания этого атома (в нашем случае «номер один») для обратного связывания.
Ветвление
[ редактировать ]Ветви SLN идентичны ветвям SMILES, но их указывают в скобках. Пропионовая кислота – это CH3CH2C(=O)OH
( ).
Реакции
[ редактировать ]SLN поддерживает реакции с ->
соединение реагентов и продуктов. Картирование атомов возможно с использованием [#num]
атрибуты. Атрибут реакционного центра (rc) можно добавить к связям, а атрибут кирального преобразования (cc) — к атомам.
Разное.
[ редактировать ]Несколько строк можно объединить в синтаксическую строку, написав \
(обратная косая черта) в конце каждой строки. Это позволяет разбить длинную линию на несколько строк, например, при реакции с каждой молекулой на отдельной линии.
См. также
[ редактировать ]- Упрощенная спецификация ввода строки молекулярного ввода (нотация SMILES)
- Смайлы произвольной целевой спецификации (нотация SMARTS)
Ссылки
[ редактировать ]- Эш, Шейла; Клайн, Малькольм А.; Гомер, Р. Вебстер; Херст, Тэд; Смит, Грегори Б. (1997). «Линейная нотация SYBYL (SLN): универсальный язык для представления химической структуры». Дж. Хим. Инф. Вычислить. наук. 37 : 71–79. дои : 10.1021/ci960109j .
- Гомер, Р. Вебстер; Суонсон, Джон; Джилек, Роберт Дж.; Херст, Тэд; Кларк, Роберт Д. (2008). «Линейная нотация SYBYL (SLN): единая нотация для представления химических структур, запросов, реакций и виртуальных библиотек». Дж. Хим. Инф. Вычислить. наук. 48 (12): 2294–2307. дои : 10.1021/ci7004687 .