Контактный соскоб
В онлайн-рекламе очистка контактов клиента — это практика получения доступа к учетной записи электронной почты с целью получения контактной информации, которая затем используется в маркетинговых целях.
The New York Times называет практику Tagged , MyLife и Desktopdating.net «скрейпингом контактов». [1]
Доступно несколько коммерческих пакетов, которые реализуют сбор контактов своих клиентов, включая ViralInviter, TrafficXplode и TheTsunamiEffect. [2]
Очистка контактов — это одно из применений очистки веб-страниц , а примерами инструментов очистки электронной почты являются Uipath, Import.io и Screen Scraper. Альтернативные инструменты веб-скрапинга включают UzunExt, функции R и Python Beautiful Soup . Юридические вопросы парсинга контактов регулируются законностью парсинга веб-страниц.
Инструменты парсинга веб-страниц
[ редактировать ]В качестве альтернативы парсингу контактов можно использовать следующие инструменты для парсинга веб-страниц:
- UzunExt — это подход к очистке данных, при котором строковые методы и процесс сканирования применяются для извлечения информации без использования дерева DOM . [3]
- функций R. Данные rm() и данные. rm.a() можно использовать в качестве стратегии парсинга веб-страниц. [4]
- Библиотеки Python Beautiful Soup можно использовать для очистки данных и преобразования данных в файлы CSV. [5]
Юридические вопросы
[ редактировать ]Соединенные Штаты
[ редактировать ]В Соединенных Штатах существуют три наиболее распространенных судебных иска, связанных с парсингом веб-страниц: нарушение авторских прав на компиляцию, нарушение Закона о компьютерном мошенничестве и злоупотреблениях (CFAA) и электронное посягательство на претензии движимого имущества. Например, пользователи «инструментов очистки» могут нарушить электронное посягательство на претензии движимого имущества. [6] Одним из хорошо известных дел является дело Intel Corp. против Хамиди , в котором суд США решил, что компьютерный контекст не включен в иски о нарушении владения по общему праву. [7] [8] Однако три юридических требования были изменены доктринально, и неясно, сохранятся ли эти требования в будущем. [6] [9] Например, сфера применения CFAA была сужена из-за технического сходства между парсингом веб-страниц и просмотром веб-страниц. [10] В деле EF Culture Travel BV против Zefer Corp. суд отказался применить CFAA, поскольку EF не выполнила стандарт «ущерба». [11]
Евросоюз
[ редактировать ]В соответствии со статьей 14 Общего регламента ЕС по защите данных (GDPR) контролеры данных обязаны информировать физических лиц перед обработкой персональных данных. [12] В деле Bisnode против надзорного органа Польши компания Bisnode получила персональные данные из государственного публичного реестра деловой активности, и эти данные были использованы в деловых целях. Однако Bisnode получил адреса электронной почты только некоторых людей, поэтому почтовые уведомления отправлялись только этим людям. Вместо того, чтобы напрямую информировать других людей, Bisnode просто разместил уведомление на своем веб-сайте и, таким образом, не выполнил обязательства по статье 14 GDPR. [13] [14]
Австралия
[ редактировать ]В Австралии программное обеспечение для сбора адресов и собранные списки адресов не должны поставляться, приобретаться или использоваться в соответствии с Законом о спаме 2003 года . Закон о спаме также требует, чтобы все маркетинговые электронные письма отправлялись с согласия получателей, и все электронные письма должны включать возможность отказа. [15] Компания, стоящая за торговыми веб-сайтами GraysOnline, была оштрафована после отправки электронных писем, нарушающих Закон о спаме. GraysOnline отправляла сообщения без возможности для получателей отказаться от получения дальнейших электронных писем, а также отправляла электронные письма людям, которые ранее отозвали свое согласие на получение электронных писем Грея. [16] [17]
Китай
[ редактировать ]В соответствии с Законом о кибербезопасности Китайской Народной Республики сканирование общедоступной информации в Интернете считается законным, однако получение непубличной конфиденциальной личной информации без согласия является незаконным. [18] 24 ноября 2017 г. три человека были признаны виновными в незаконном сборе данных информационных систем, хранящихся на сервере Beijing ByteDance Networking Technology Co., Ltd. [19]
См. также
[ редактировать ]- Парсинг веб-страниц
- Парсинг данных
- Извлечение информации
- Веб-сканер
- Веб-архивирование
- Парсинг поисковых систем
Ссылки
[ редактировать ]- ^ Ввод адреса электронной почты и отказ от адресов друзей
- ^ «Вирусным приглашенным» нужен ваш список контактов по электронной почте.
- ^ Узун, Э. (2020). «Новый подход к парсингу веб-страниц с использованием дополнительной информации, полученной с веб-страниц» . Доступ IEEE . 8 : 61726–61740. Бибкод : 2020IEEA...861726U . дои : 10.1109/ACCESS.2020.2984503 . ISSN 2169-3536 . S2CID 215740364 .
- ^ Валлоне А., Коро К. и Беатрис С. (2020). «Стратегии доступа к городским пространственным данным через Интернет для социально-экономических исследований с использованием функций R». Журнал географических систем: пространственная теория, модели, методы и данные . 22 (2): 217–34. Бибкод : 2020JGS....22..217В . дои : 10.1007/s10109-019-00309-y . hdl : 10486/709503 . S2CID 202181499 .
{{cite journal}}
: CS1 maint: несколько имен: список авторов ( ссылка ) - ^ Вела, Вифлеем; Каверо, Джозеф Мэри; Касерес, Голубь; Слоуп, Чарльз Э. (2019). «Полуавтоматический метод очистки данных для сферы общественного транспорта» . Доступ IEEE . 7 : 105627–105637. Бибкод : 2019IEEA...7j5627V . дои : 10.1109/access.2019.2932197 . hdl : 10115/29735 . ISSN 2169-3536 . S2CID 201068464 .
- ^ Перейти обратно: а б Хирши, Джеффри (2014). «Симбиотические отношения: прагматическое принятие очистки данных» . Электронный журнал ССРН . дои : 10.2139/ssrn.2419167 . ISSN 1556-5068 .
- ^ «Интернет-право, глава 06: Посягательство на движимое имущество» . www.tomwbell.com . Проверено 12 ноября 2020 г.
- ^ Бекхэм, Дж. Брайан (2003). «Intel против Хамиди: Спам как посягательство на движимое имущество – деконструкция частного права на иск в Калифорнии» . Журнал Джона Маршалла по информационным технологиям и праву конфиденциальности . 22 : 205–228.
- ^ «Часто задаваемые вопросы о ссылках: являются ли условия использования веб-сайта обязательными для заключения контрактов?» . www.chillingeffects.org. 20 августа 2007 г. Архивировано из оригинала 8 марта 2002 г. Проверено 20 августа 2007 г.
- ^ Кристенсен, Дж. (2020). «Упадок CFAA в случаях сбора данных». Журнал Нотр-Дам по праву, этике и государственной политике . 34 (2): 529–47.
- ^ «Споры вокруг «скребков экрана»: программное обеспечение помогает пользователям получать доступ к веб-сайтам, но деятельность конкурентов подвергается тщательной проверке» . Финдлоу . Проверено 12 ноября 2020 г.
- ^ Филип Х. Лю, Марк Эдвард Дэвис (2015–16). «Скрапинг веб-страниц — ограничения на бесплатные образцы». Оползень . 8 .
- ^ Томаш Пикулика, Петер Стархонь (2020). «Публичные записи с личными данными находятся под контролем регуляторов DPA» . Procedia Информатика . 170 :1174–1179. дои : 10.1016/j.procs.2020.03.033 .
- ^ Оксфорд Аналитика (2019). «Национальные регуляторы Европы — ключ к успеху GDPR». Экспертные брифинги .
- ^ Инфраструктура. «Закон о спаме 2003 г.» . www.legislation.gov.au . Проверено 1 декабря 2020 г.
- ^ Торресан, Даниэль (2013). «Поддержание хороших компаний». Информировать . 65 : 668–669.
- ^ «Несанкционированные фотографии в Интернете — снова в повестке дня Генпрокуратуры». Интернет-правовой бюллетень . 8 . 2005.
- ^ Ли, Джих-Ан (2018). «Взлом на закон Китая о кибербезопасности» (PDF) . Обзор закона Уэйк Форест . 53 : 57–104.
- ^ Ли Цянь, Цзян Тао (2020). «Переосмысление уголовных санкций за сбор данных в Китае на основе примера незаконного получения конкретных данных сканерами». Китайская юридическая наука . 8 : 136.