Индексация скрытой семантической структуры
Индексация скрытой семантической структуры ( LaSSI ) — это метод расчета химического сходства, полученный на основе скрытого семантического анализа (LSA).
LaSSI был разработан компанией Merck & Co. и запатентован в 2007 году. [1] Ричард Халл, Юджин Флюдер, Суреш Сингх, Роберт Шеридан, Роберт Накбар и Саймон Кирсли.
Обзор
[ редактировать ]LaSSI похож на LSA в том, что он включает в себя построение матрицы вхождений из набора элементов и применение разложения по сингулярным значениям к этой матрице для получения скрытых функций. Отличие состоит в том, что матрица встречаемости представляет частоту двух- и трехмерных химических дескрипторов (а не терминов естественного языка), обнаруженных в химической базе данных химических структур. В результате этого процесса выявляются концепции скрытой химической структуры, которые можно использовать для расчета химического сходства и взаимосвязей структура-активность для открытия лекарств .
Ссылки
[ редактировать ]- Халл Р.Д., Флюдер Э.М., Сингх С.Б., Начбар Р.Б., Шеридан Р.П. и Кирсли С.К. (2001) «Индексация скрытой семантической структуры (LaSSI) для определения химического сходства». J Med Chem, 12 апреля 2001 г.; 44 (8): 1177–84. дои : 10.1021/jm000393c
- Халл Р.Д., Сингх С.Б., Начбар Р.Б., Шеридан Р.П., Кирсли С.К. и Флудер Е.М. (2001) «Поиск химического сходства с использованием индексации скрытой семантической структуры (LaSSI) и сравнения с TOPOSIM». J Med Chem, 12 апреля 2001 г.; 44 (8): 1185–91.
- Сингх С.Б., Шеридан Р.П., Флудер Э.М. и Халл Р.Д. (2001) «Горные работы в химическом карьере с помощью совместных химических зондов: применение индексации скрытой семантической структуры (LaSSI) и TOPOSIM (Dice) для анализа химических баз данных». J Med Chem, 10 мая 2001 г.; 44 (10): 1564–75.