Случайное картографирование
Эта статья в значительной степени или полностью опирается на один источник . ( апрель 2024 г. ) |
Для анализа данных случайное сопоставление (RM) — это метод быстрого уменьшения размерности, относящийся к категории методов извлечения признаков . RM заключается в создании случайной матрицы, которая умножается на каждый исходный вектор и дает уменьшенный вектор. Когда векторы данных являются многомерными, с вычислительной точки зрения невозможно использовать алгоритмы анализа данных или распознавания образов, которые неоднократно вычисляют сходства или расстояния в исходном пространстве данных. Поэтому необходимо уменьшить размерность, например, перед кластеризацией данных. В контексте интеллектуального анализа текста показано, что точность классификации документов , полученная после уменьшения размерности с использованием метода случайного отображения, будет почти такой же хорошей, как исходная точность, если конечная размерность достаточно велика (около 100 из 6000). Фактически, можно показать, что внутренний продукт (сходство) между сопоставленными векторами точно соответствует внутреннему продукту исходных векторов .
См. также
[ редактировать ]Ссылки
[ редактировать ]- Каски, С. Уменьшение размерности путем случайного отображения: быстрое вычисление сходства для кластеризации. Материалы Международной совместной конференции IEEE по нейронным сетям 1998 г., 1998. стр. 413–418. doi: 10.1109/IJCNN.1998.682302