Графический спам
спам на основе изображений , [3] [4] или спам с изображениями — это разновидность спама по электронной почте , при котором текстовое спам-сообщение встраивается в изображения, которые затем прикрепляются к спам-сообщениям. [5] Поскольку большинство почтовых клиентов отображают файл изображения непосредственно пользователю, спам-сообщение передается сразу после открытия электронного письма (нет необходимости дополнительно открывать прикрепленный файл изображения).
Техника
[ редактировать ]Цель спама с изображениями, очевидно, состоит в том, чтобы обойти анализ текстового содержимого электронной почты, выполняемый большинством спам-фильтров. [5] (например, SpamAssassin, RadicalSpam , Bogofilter, SpamBayes). Соответственно, по той же причине вместе с прикрепленным изображением спамеры часто добавляют в письмо некоторый «фиктивный» текст, а именно ряд слов, которые с наибольшей вероятностью появятся в легитимных письмах, а не в спаме.Более ранние спам-сообщения с изображениями содержали спам-изображения с чистым и легко читаемым текстом, как показано на рис. 1.
Обнаружение
[ редактировать ]Следовательно, инструменты оптического распознавания символов использовались для извлечения текста, встроенного в спам-изображения, который затем мог быть обработан вместе с текстом в теле электронного письма с помощью спам-фильтра или, в более общем смысле, с помощью более сложных методов категоризации текста. [3] [6] Кроме того, были также созданы подписи (например, хеширование MD5), чтобы легко обнаружить и заблокировать уже известные спам-изображения. Спамеры, в свою очередь, отреагировали, применив некоторые методы запутывания к спам-изображениям, аналогично CAPTCHA , как для того, чтобы предотвратить чтение встроенного текста инструментами OCR, так и для того, чтобы ввести в заблуждение обнаружение на основе сигнатур. Некоторые примеры показаны на рис. 2.
Это подняло вопрос об улучшении обнаружения спама с изображениями с использованием методов компьютерного зрения и распознавания образов. [3] [4] [7] [8]
В частности, несколько авторов исследовали возможность распознавания спама в изображениях с помощью запутанных изображений с помощью общих характеристик изображения низкого уровня (таких как количество цветов, преобладающий цветовой охват, соотношение сторон изображения, текстовая область), метаданные изображения и т. д. [7] [8] [9] [10] (видеть [4] для комплексного обследования).Примечательно, что некоторые авторы также пытались обнаружить наличие текста на прикрепленных изображениях с артефактами, обозначающими попытку противника его запутать. [11] [12] [13] [14]
История
[ редактировать ]Распространение графического спама началось в 2004 году и достигло пика в конце 2006 года, когда более 50% спама составляло графический спам. В середине 2007 года он начал снижаться и практически исчез в 2008 году. [1] Причину этого явления понять непросто. Снижение количества графического спама, вероятно, можно объяснить как улучшением предлагаемых мер противодействия (например, быстрым детекторам графического спама на основе визуальных особенностей), так и более высокими требованиями к полосе пропускания графического спама, которые вынуждают спамеров отправлять меньшее количество спама. спама за заданный интервал времени. Оба фактора могли сделать графический спам менее удобным для спамеров, чем другие виды спама.Тем не менее, в конце 2011 года было обнаружено возрождение графического спама, и графический спам достиг 8% всего спам-трафика, хотя и на небольшой период. [2]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б IBM X-Force® 2010, Отчет о тенденциях и рисках за полугодие (август 2010 г.).
- ^ Jump up to: а б IBM X-Force® 2012, Отчет о тенденциях и рисках за полугодие (сентябрь 2012 г.).
- ^ Jump up to: а б с Джорджио Фумера, Игнацио Пиллаи, Фабио Роли, «Фильтрация спама на основе анализа текстовой информации, встроенной в изображения» . Журнал исследований машинного обучения (специальный выпуск «Машинное обучение в компьютерной безопасности»), vol. 7, стр. 2699-2720, 12/2006.
- ^ Jump up to: а б с Баттиста Биджио, Джорджо Фумера, Игнацио Пиллаи, Фабио Роли, Биджио, Баттиста; Фумера, Джорджио; Пиллаи, Игнацио; Роли, Фабио (2011). «Обзор и экспериментальная оценка методов фильтрации спама в изображениях, письма с распознаванием образов». Буквы для распознавания образов . 32 (10): 1436–1446. дои : 10.1016/j.patrec.2011.03.022 . Том 32, выпуск 10, 15 июля 2011 г., страницы 1436–1446, ISSN 0167–8655.
- ^ Jump up to: а б Ли, Сиюань; Ли, Жуйгуан; Сюй, Юань; Чжоу, Хао; Ян, Ханьбин; Сюй, Бин; Чжан, Хунган (01 сентября 2018 г.). «Распознавание китайских символов на основе WAF для фильтрации спам-изображений» . Китайский журнал электроники . 27 (5): 1050–1055. дои : 10.1049/cje.2018.06.014 . ISSN 1022-4653 .
- ^ «Плагин Bayes OCR Spam Assassin» .
- ^ Jump up to: а б Арадье Х., Майерс Г., Херсон Дж. А., 2005. Анализ изображений для эффективной категоризации спама по электронной почте на основе изображений. В: Учеб. Межд. Конф. по анализу и распознаванию документов, стр. 914–918.
- ^ Jump up to: а б Дредзе М., Геварьяху Р., Элиас-Бахрах А., 2007. Изучение быстрых классификаторов графического спама. В: Учеб. 4-я Конф. по электронной почте и борьбе со спамом (CEAS)
- ^ Ву, К.-Т., Ченг, К.-Т., Чжу, К., Ву, Ю.-Л., 2005. Использование визуальных функций для фильтрации спама. В: Учеб. IEEE Международный. Конф. по обработке изображений, Vol. III.стр. 501–504.
- ^ Лю, К., Цинь, З., Ченг, Х., Ван, М., 2010. Эффективное моделирование спам-изображений. В: Межд. Симп. по интеллектуальным информационным технологиям и информатике безопасности. Компьютерное общество IEEE, стр. 663–666.
- ^ «Fuzzy — плагин OCR Spam Assassin» .
- ^ Баттиста Биггио, Джорджио Фумера, Игнацио Пиллаи, Фабио Роли, « Фильтрация спама изображений с использованием визуальной информации », 14-й межд. Конф. по анализу и обработке изображений (ICIAP 2007), Модена, Италия, Компьютерное общество IEEE, стр. 105–110, 09.10.2007.
- ^ Фабио Роли, Баттиста Биджио, Джорджио Фумера, Игнацио Пиллаи, Риккардо Сатта, «Фильтрация спама изображений путем обнаружения состязательного запутанного текста», Семинар по нейронным системам обработки информации (NIPS), Уистлер, Британская Колумбия, Канада, 12 августа 2007 г. .
- ^ Баттиста Биггио, Джорджио Фумера, Игнацио Пиллаи, Фабио Роли, «Улучшение фильтрации спама изображений с использованием функций текста изображения», Пятая конференция по электронной почте и борьбе со спамом (CEAS 2008), Маунтин-Вью, Калифорния, США, 21 августа 2008 г.