Jump to content

лоскутный

лоскутный
Разработчик(и) Zyte (ранее Scrapinghub)
Первоначальный выпуск 26 июня 2008 г. ( 26 июня 2008 г. )
Стабильная версия
2.11.2 [ 1 ]  Отредактируйте это в Викиданных / 14 мая 2024 г .; 2 месяца назад ( 14 мая 2024 г. )
Репозиторий
Написано в Питон
Операционная система Windows , MacOS , Linux
Тип Веб-сканер
Лицензия Лицензия БСД
Веб-сайт царапающий .org  Edit this on Wikidata

Scrapy ( / ˈ sk r p / [ 2 ] SKRAY -peye ) — это с открытым исходным кодом, для веб-сканирования бесплатная платформа написанная на Python. Первоначально разработанный для парсинга веб-страниц , он также может использоваться для извлечения данных с помощью API или в качестве веб-сканера общего назначения. [ 3 ] В настоящее время его поддерживает Zyte (ранее Scrapinghub ), компания, занимающаяся разработкой и услугами веб-скрапинга.

Архитектура проекта Scrapy построена на «пауках», которые представляют собой автономные сканеры, которым дается набор инструкций. Следуя духу других фреймворков, не повторяйте себя , таких как Django , [ 4 ] это упрощает создание и масштабирование крупных проектов сканирования, позволяя разработчикам повторно использовать свой код.

Некоторые известные компании и продукты, использующие Scrapy: Lyst, [ 5 ] [ 6 ] Parse.ly , [ 7 ] Сайон Технологии , [ 8 ] Sciences Po Medialab, [ 9 ] Data.gov.uk. Сайт данных мирового правительства [ 10 ]

Scrapy родился в лондонской компании Mydeco, занимающейся веб-агрегацией и электронной коммерцией, где его разрабатывали и поддерживали сотрудники Mydeco и Insophia (веб-консалтинговая компания, базирующаяся в Монтевидео , Уругвай). Первый публичный выпуск состоялся в августе 2008 года под лицензией BSD , а выпуск версии 1.0 состоялся в июне 2015 года. [ 11 ] В 2011 году новым официальным сопровождающим стал Zyte (ранее Scrapinghub). [ 12 ] [ 13 ]

  1. ^ «Выпуск 2.11.2» . 14 мая 2024 г. Проверено 17 мая 2024 г.
  2. ^ Коммит 975f150
  3. ^ Краткий обзор Scrapy .
  4. ^ «Часто задаваемые вопросы» . Часто задаваемые вопросы, документация Scrapy 2.8.0 . Проверено 28 июля 2015 г.
  5. ^ Белл, Эдди; Хойссер, Джонатан. «Масштабируемый парсинг с использованием машинного обучения» . Архивировано из оригинала 4 июня 2016 года . Проверено 28 июля 2015 г.
  6. ^ Скрэпи | Компании, использующие Scrapy
  7. ^ Монталенти, Эндрю (27 октября 2012 г.). «Веб-сканирование и извлечение метаданных в Python» . Веб-сканирование и извлечение метаданных в Python — Доклад докладчика . Проверено 11 мая 2015 г.
  8. ^ «Недобросовестные компании» . Скрэпи | Компании, использующие Scrapy .
  9. ^ Hyphe v0.0.0: вышла первая версия нашего нового веб-сканера!
  10. ^ Бен Фиршман [@bfirsh] (21 января 2010 г.). «На сайте World Govt Data используются Django, Solr, Haystack, Scrapy и другие интересные модные словечки http://bit.ly/5jU3La #opendata #datastore» ( твит ) – через Twitter .
  11. ^ Медина, Джулия (19 июня 2015 г.). «Вышел официальный релиз Scrapy 1.0!» . Scrapy-users (список рассылки).
  12. ^ Хоффман, Пабло (2013). Список основных авторов и участников . Проверено 18 ноября 2013 г.
  13. ^ Центр очистки интервью .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: c1233184c253a3e4127ccec3193c7e9b__1700571840
URL1:https://arc.ask3.ru/arc/aa/c1/9b/c1233184c253a3e4127ccec3193c7e9b.html
Заголовок, (Title) документа по адресу, URL1:
Scrapy - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)