Разреженное бинарное полиномиальное хеширование
Разреженное бинарное полиномиальное хеширование (SBPH) — это обобщение байесовской фильтрации спама , которое может сопоставлять как мутирующие фразы, так и отдельные слова.
SBPH — это способ автоматического создания большого количества признаков из входящего текста , а затем использования статистики для определения весов каждого из этих признаков с точки зрения их прогнозных значений для оценки спама /неспама.
Внешние ссылки
[ редактировать ]- Статья на эту тему, связанную со спамом (некоторые тексты статей взяты из этого документа, находящегося под GFDL).
- Покончить со спамом: байесовская фильтрация контента и искусство статистической классификации языков . Нет крахмального пресса. 2005. с. 108. ИСБН 978-1-59327-052-0 .