Jump to content

Байесовское отравление

Байесовское отравление — это метод, используемый спамерами электронной почты , чтобы попытаться снизить эффективность спам-фильтров , основанных на байесовской фильтрации спама . Байесовская фильтрация опирается на байесовскую вероятность , чтобы определить, является ли входящее письмо спамом или нет. Спамер надеется, что добавление случайных (или даже тщательно отобранных) слов, которые вряд ли появятся в спам-сообщении, заставит спам-фильтр поверить в достоверность сообщения — статистическая ошибка II рода .

Спаммеры также надеются повысить уровень ложных срабатываний спам-фильтра, превращая ранее невинные слова в спам-слова в байесовской базе данных (статистические ошибки типа I ), поскольку пользователь, обучающий свой спам-фильтр на отравленном сообщении, будет указывать на фильтр, что слова, добавленные спамером, являются хорошим признаком спама.

Эмпирические результаты

[ редактировать ]

Грэм-Камминг

[ редактировать ]

На конференции по спаму, проходившей в Массачусетском технологическом институте в 2004 году, Джон Грэм-Камминг представил две возможные атаки на . байесовский механизм POPFile [1] Один оказался неудачным, а другой работал, но оказался непрактичным. При этом они определили два типа атак-отравителей: пассивный (когда слова добавляются без какой-либо обратной связи со спамером) и активный (когда спамер получает обратную связь после получения спама).

Пассивный метод добавления случайных слов в небольшой спам оказался неэффективным как метод атаки: было доставлено только 0,04% модифицированных спам-сообщений. Активная атака заключалась в добавлении случайных слов в небольшой спам и использовании веб-жука для определения того, был ли получен спам. Если бы это было так, то другая байесовская система была обучена с использованием тех же ядовитых слов. Отправив 10 000 спам-сообщений одному пользователю, он определил небольшой набор слов, которые можно было использовать для передачи спама.

Простая мера по отключению удаленных изображений ( веб-ошибок ) в электронных письмах устраняет эту проблему.

Виттель и Ву

[ редактировать ]

На конференции по электронной почте и борьбе со спамом в 2004 году Виттель и Ву представили доклад. [2] в котором они показали, что пассивное добавление случайных слов в спам было неэффективно против CRM114 , но эффективно против SpamBayes , когда на спам добавлялось 100 слов.

Они также показали, что более умная пассивная атака с добавлением общеупотребительных английских слов по-прежнему неэффективна против CRM114, но еще более эффективна против SpamBayes. Чтобы пройти спам через SpamBayes, им нужно было добавить всего 50 слов в спам.

Однако тестирование Виттеля и Ву подверглось критике из-за минимальной информации в заголовках, которая присутствовала в электронных письмах, которые они использовали; большинство байесовских спам-фильтров широко используют информацию заголовка и другие метаданные сообщения для определения вероятности того, что сообщение является спамом. Обсуждение результатов SpamBayes и некоторые контрдоказательства можно найти в архиве списка рассылки SpamBayes. [3]

Все эти атаки относятся к атакам типа II: атакам, направленным на доставку спама. Атака типа I пытается вызвать ложные срабатывания, превращая ранее невинные слова в спам-слова в байесовской базе данных.

Стерн, Мейсон и Шепард

[ редактировать ]

Также в 2004 году Стерн, Мейсон и Шепард написали технический отчет в Университете Далхаузи . [4] в котором они подробно описали пассивную атаку типа II. Они добавили общие английские слова в спам-сообщения, используемые для обучения и тестирования спам-фильтра.

В двух тестах они показали, что эти общие слова снижают точность спам-фильтра (процент сообщений, классифицированных как спам, которые на самом деле являются спамом) с 84% до 67% и с 94% до 84%. Изучение их данных показывает, что отравленный фильтр был склонен полагать, что сообщения скорее были спамом, чем «хамством» (хорошим электронным письмом), что увеличивало уровень ложных срабатываний.

Они предложили две контрмеры: игнорирование общих слов при классификации и сглаживание вероятностей на основе достоверности слова. Слово имеет достоверную вероятность, если злоумышленник вряд ли сможет догадаться, является ли оно частью словарного запаса человека. Таким образом, общие слова не заслуживают доверия, и их вероятность будет сглажена до 0,5 (что сделает их нейтральными).

Лоуд и Мик

[ редактировать ]

На конференции 2005 года по электронной почте и борьбе со спамом Лоуд и Мик представили доклад. [5] в котором они продемонстрировали, что пассивные атаки, добавляющие в спам случайные или общие слова, неэффективны против наивного байесовского фильтра. (Фактически они показали, как продемонстрировал Джон Грэм-Камминг еще в 2004 году, что добавление случайных слов повышает точность фильтрации спама.)

Они продемонстрировали, что добавление неуместных слов — слов, которые с большей вероятностью появятся в неспам-содержимом электронной почты, чем в спаме, — эффективно против наивного байесовского фильтра и позволяет спаму проскользнуть. Далее они подробно описали две активные атаки (атаки, требующие обратной связи со спамером), которые были очень эффективны против спам-фильтров. Конечно, предотвращение любой обратной связи со спамерами (например, отчетов о недоставке, ошибок уровня SMTP или веб-ошибок) тривиально побеждает активную атаку.

Они также показали, что переобучение фильтра эффективно предотвращает все типы атак, даже если данные переобучения были искажены.

Опубликованные исследования показывают, что добавление случайных слов в спам-сообщения неэффективно как форма атаки, но активные атаки очень эффективны и что добавление тщательно выбранных слов может сработать в некоторых случаях. Для защиты от этих атак крайне важно, чтобы спамеры не получали никакой обратной связи и чтобы статистические фильтры регулярно переобучались.

Исследование также показывает, что стоит продолжать расследование атак на статистические фильтры. Были продемонстрированы работающие атаки, и необходимы контрмеры для обеспечения точности статистических фильтров.

См. также

[ редактировать ]
  1. ^ «Архивная копия» . Архивировано из оригинала 12 октября 2006 г. Проверено 24 ноября 2006 г. {{cite web}}: CS1 maint: архивная копия в заголовке ( ссылка )
  2. ^ «Архивная копия» (PDF) . Архивировано из оригинала (PDF) 29 апреля 2013 г. Проверено 13 февраля 2012 г. {{cite web}}: CS1 maint: архивная копия в заголовке ( ссылка )
  3. ^ «The spambayes-dev, сентябрь 2004 г. Архив по теме» .
  4. ^ «Технические отчеты – Факультет компьютерных наук» .
  5. ^ «Архивная копия» (PDF) . www.ceas.cc. ​Архивировано из оригинала (PDF) 20 марта 2022 года . Проверено 30 июня 2022 г. {{cite web}}: CS1 maint: архивная копия в заголовке ( ссылка )
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: fbd25a62eae78ecce24c1e254c7a5a3c__1716004500
URL1:https://arc.ask3.ru/arc/aa/fb/3c/fbd25a62eae78ecce24c1e254c7a5a3c.html
Заголовок, (Title) документа по адресу, URL1:
Bayesian poisoning - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)