Семантическое картирование (статистика)
Семантическое отображение ( СМ ) — это статистический метод уменьшения размерности (преобразования данных из многомерного пространства в низкомерное пространство). SM можно использовать в наборе многомерных векторов признаков для извлечения нескольких новых признаков, сохраняющих основные характеристики данных.
SM выполняет уменьшение размерности путем кластеризации исходных объектов в семантические кластеры и объединения объектов, сопоставленных в одном кластере, для создания извлеченного объекта. Учитывая набор данных , этот метод создает матрицу проекции , которую можно использовать для отображения элемента данных из многомерного пространства в пространство уменьшенной размерности.
СМ может применяться при построении систем интеллектуального анализа текста и информационного поиска , а также систем управления векторами высокой размерности. SM является альтернативой случайному отображению , анализу главных компонент и методам скрытой семантической индексации .
См. также
[ редактировать ]- Уменьшение размерности
- Анализ основных компонентов
- Скрытая семантическая индексация
- Унификация (логическое сокращение)
Ссылки
[ редактировать ]- КОРРЕА, РФ; ЛЮДЕРМИР, ТБ. Улучшение самоорганизации коллекций документов с помощью семантического картирования. Neurocomputing (Амстердам), т. 70, с. 62-69, 2006. doi:10.1016/j.neucom.2006.07.007.
- КОРРЕА, РФ и ЛЮДЕРМИР, ТБ (2007) «Уменьшение размерности очень больших коллекций документов с помощью семантического картирования» . Материалы 6-го Межд. Семинар по самоорганизующимся картам (WSOM). ISBN 978-3-00-022473-7 .