Jump to content

Графический спам

Рис. 1. Пример чистого спам-изображения
Рис. 2. Примеры замаскированных спам-изображений для уклонения от обнаружения с помощью оптического распознавания символов и сигнатур
Рис. 3. Средний размер спама в зависимости от процента спама с изображениями [1]
Рис. 4. Средний размер спама в зависимости от процента спама в виде изображений и ZIP/RAR (2011–2012 гг., в неделю) [2]

спам на основе изображений , [3] [4] или спам с изображениями — это разновидность спама по электронной почте , при котором текстовое спам-сообщение встраивается в изображения, которые затем прикрепляются к спам-сообщениям. [5] Поскольку большинство почтовых клиентов отображают файл изображения непосредственно пользователю, спам-сообщение передается сразу после открытия электронного письма (нет необходимости дополнительно открывать прикрепленный файл изображения).

Цель спама с изображениями, очевидно, состоит в том, чтобы обойти анализ текстового содержимого электронной почты, выполняемый большинством спам-фильтров. [5] (например, SpamAssassin, RadicalSpam , Bogofilter, SpamBayes). Соответственно, по той же причине вместе с прикрепленным изображением спамеры часто добавляют в письмо некоторый «фиктивный» текст, а именно ряд слов, которые с наибольшей вероятностью появятся в легитимных письмах, а не в спаме.Более ранние спам-сообщения с изображениями содержали спам-изображения с чистым и легко читаемым текстом, как показано на рис. 1.

Обнаружение

[ редактировать ]

Следовательно, инструменты оптического распознавания символов использовались для извлечения текста, встроенного в спам-изображения, который затем мог быть обработан вместе с текстом в теле электронного письма с помощью спам-фильтра или, в более общем смысле, с помощью более сложных методов категоризации текста. [3] [6] Кроме того, были также созданы подписи (например, хеширование MD5), чтобы легко обнаружить и заблокировать уже известные спам-изображения. Спамеры, в свою очередь, отреагировали, применив некоторые методы запутывания к спам-изображениям, аналогично CAPTCHA , как для того, чтобы предотвратить чтение встроенного текста инструментами OCR, так и для того, чтобы ввести в заблуждение обнаружение на основе сигнатур. Некоторые примеры показаны на рис. 2.

Это подняло вопрос об улучшении обнаружения спама с изображениями с использованием методов компьютерного зрения и распознавания образов. [3] [4] [7] [8]

В частности, несколько авторов исследовали возможность распознавания спама в изображениях с помощью запутанных изображений с помощью общих характеристик изображения низкого уровня (таких как количество цветов, преобладающий цветовой охват, соотношение сторон изображения, текстовая область), метаданные изображения и т. д. [7] [8] [9] [10] (видеть [4] для комплексного обследования).Примечательно, что некоторые авторы также пытались обнаружить наличие текста на прикрепленных изображениях с артефактами, обозначающими попытку противника его запутать. [11] [12] [13] [14]

Распространение графического спама началось в 2004 году и достигло пика в конце 2006 года, когда более 50% спама составляло графический спам. В середине 2007 года он начал снижаться и практически исчез в 2008 году. [1] Причину этого явления понять непросто. Снижение количества графического спама, вероятно, можно объяснить как улучшением предлагаемых мер противодействия (например, быстрым детекторам графического спама на основе визуальных особенностей), так и более высокими требованиями к полосе пропускания графического спама, которые вынуждают спамеров отправлять меньшее количество спама. спама за заданный интервал времени. Оба фактора могли сделать графический спам менее удобным для спамеров, чем другие виды спама.Тем не менее, в конце 2011 года было обнаружено возрождение графического спама, и графический спам достиг 8% всего спам-трафика, хотя и на небольшой период. [2]

См. также

[ редактировать ]
  1. ^ Jump up to: а б IBM X-Force® 2010, Отчет о тенденциях и рисках за полугодие (август 2010 г.).
  2. ^ Jump up to: а б IBM X-Force® 2012, Отчет о тенденциях и рисках за полугодие (сентябрь 2012 г.).
  3. ^ Jump up to: а б с Джорджио Фумера, Игнацио Пиллаи, Фабио Роли, «Фильтрация спама на основе анализа текстовой информации, встроенной в изображения» . Журнал исследований машинного обучения (специальный выпуск «Машинное обучение в компьютерной безопасности»), vol. 7, стр. 2699-2720, 12/2006.
  4. ^ Jump up to: а б с Баттиста Биджио, Джорджо Фумера, Игнацио Пиллаи, Фабио Роли, Биджио, Баттиста; Фумера, Джорджио; Пиллаи, Игнацио; Роли, Фабио (2011). «Обзор и экспериментальная оценка методов фильтрации спама в изображениях, письма с распознаванием образов». Буквы для распознавания образов . 32 (10): 1436–1446. дои : 10.1016/j.patrec.2011.03.022 . Том 32, выпуск 10, 15 июля 2011 г., страницы 1436–1446, ISSN 0167–8655.
  5. ^ Jump up to: а б Ли, Сиюань; Ли, Жуйгуан; Сюй, Юань; Чжоу, Хао; Ян, Ханьбин; Сюй, Бин; Чжан, Хунган (01 сентября 2018 г.). «Распознавание китайских символов на основе WAF для фильтрации спам-изображений» . Китайский журнал электроники . 27 (5): 1050–1055. дои : 10.1049/cje.2018.06.014 . ISSN   1022-4653 .
  6. ^ «Плагин Bayes OCR Spam Assassin» .
  7. ^ Jump up to: а б Арадье Х., Майерс Г., Херсон Дж. А., 2005. Анализ изображений для эффективной категоризации спама по электронной почте на основе изображений. В: Учеб. Межд. Конф. по анализу и распознаванию документов, стр. 914–918.
  8. ^ Jump up to: а б Дредзе М., Геварьяху Р., Элиас-Бахрах А., 2007. Изучение быстрых классификаторов графического спама. В: Учеб. 4-я Конф. по электронной почте и борьбе со спамом (CEAS)
  9. ^ Ву, К.-Т., Ченг, К.-Т., Чжу, К., Ву, Ю.-Л., 2005. Использование визуальных функций для фильтрации спама. В: Учеб. IEEE Международный. Конф. по обработке изображений, Vol. III.стр. 501–504.
  10. ^ Лю, К., Цинь, З., Ченг, Х., Ван, М., 2010. Эффективное моделирование спам-изображений. В: Межд. Симп. по интеллектуальным информационным технологиям и информатике безопасности. Компьютерное общество IEEE, стр. 663–666.
  11. ^ «Fuzzy — плагин OCR Spam Assassin» .
  12. ^ Баттиста Биггио, Джорджио Фумера, Игнацио Пиллаи, Фабио Роли, « Фильтрация спама изображений с использованием визуальной информации », 14-й межд. Конф. по анализу и обработке изображений (ICIAP 2007), Модена, Италия, Компьютерное общество IEEE, стр. 105–110, 09.10.2007.
  13. ^ Фабио Роли, Баттиста Биджио, Джорджио Фумера, Игнацио Пиллаи, Риккардо Сатта, «Фильтрация спама изображений путем обнаружения состязательного запутанного текста», Семинар по нейронным системам обработки информации (NIPS), Уистлер, Британская Колумбия, Канада, 12 августа 2007 г. .
  14. ^ Баттиста Биггио, Джорджио Фумера, Игнацио Пиллаи, Фабио Роли, «Улучшение фильтрации спама изображений с использованием функций текста изображения», Пятая конференция по электронной почте и борьбе со спамом (CEAS 2008), Маунтин-Вью, Калифорния, США, 21 августа 2008 г.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: ce3a1b0a9dba0fcd903d649f38fa9f4b__1697119680
URL1:https://arc.ask3.ru/arc/aa/ce/4b/ce3a1b0a9dba0fcd903d649f38fa9f4b.html
Заголовок, (Title) документа по адресу, URL1:
Image spam - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)