Jump to content

Диффбот

Диффбот
Тип компании Частная компания
Промышленность Интернет
Основатель Майк Тунг
Штаб-квартира ,
НАС
Обслуживаемая территория
По всему миру
Ключевые люди
Услуги Веб-API , Корпоративный поиск , Парсинг веб-страниц , Сканирование веб-страниц
Веб-сайт www.diffbot.com

Diffbot — разработчик алгоритмов машинного обучения и компьютерного зрения , а также общедоступных API для извлечения данных с веб-страниц и веб-скрапинга для создания базы знаний .

Компания привлекла интерес благодаря применению технологии компьютерного зрения к веб-страницам, при котором она визуально анализирует веб-страницу на наличие важных элементов и возвращает их в структурированном формате . [1] В 2015 году Diffbot объявил, что работает над своей версией автоматизированной « График знаний », сканируя Интернет и используя автоматическое извлечение веб-страниц для создания большой базы данных структурированных веб-данных. [2] В 2019 году Diffbot опубликовал свою диаграмму знаний, которая с тех пор выросла и включает более 2 миллиардов объектов (корпораций, людей, статей, продуктов, дискуссий и т. д.) и 10 триллионов «фактов».

Продукты компании позволяют разработчикам программного обеспечения анализировать домашние страницы веб-сайтов и страницы статей. [3] и извлечь «важную информацию», игнорируя элементы, которые не считаются ключевыми для основного контента. [4]

В августе 2012 года компания выпустила API-интерфейс классификатора страниц, который автоматически классифицирует веб-страницы по определенным «типам страниц». [5] В рамках этого Diffbot проанализировал 750 000 веб-страниц, опубликованных в социальной сети Twitter , и обнаружил, что фотографии, а затем статьи и видео являются преобладающими веб-медиа, публикуемыми в социальной сети. [6]

В сентябре 2020 года компания выпустила API обработки естественного языка для автоматического построения графиков знаний из текста. [7] [8] В мае 2012 года компания привлекла финансирование в размере 2 миллионов долларов от таких инвесторов, как Энди Бехтольшейм и Скай Дейтон . [9]

Клиентами Diffbot являются Adobe , AOL , Cisco , DuckDuckGo , eBay , Instapaper , Microsoft , Onswipe и Springpad . [4] [5] [10]

См. также

[ редактировать ]
  1. ^ «Diffbot позволяет разработчикам перемещаться по коду так, как наши глаза видят мир» . TheNextWeb. 25 августа 2011 года . Проверено 21 апреля 2013 г.
  2. ^ «Стартап выпускает клон Google Knowledge Graph » . Проводной. 4 июня 2015 г. Проверено 15 июня 2015 г.
  3. ^ «Diffbot помогает приложениям читать Интернет как люди» . ГигаОм. 25 августа 2011 года . Проверено 14 марта 2013 г.
  4. ^ Jump up to: а б «Инвесторы поддерживают робота визуального обучения Diffbot для веб-контента» . Уолл Стрит Джорнал. 31 мая 2012 года . Проверено 14 марта 2013 г.
  5. ^ Jump up to: а б «Новый API DiffBot блестяще показывает, что скрывается за любой ссылкой» . 16 августа 2012 года . Проверено 14 марта 2013 г.
  6. ^ «Твиттер: Один день из жизни» . Машаемый . 16 августа 2012 года . Проверено 14 марта 2013 г.
  7. ^ «Новый инструмент искусственного интеллекта отображает библейские семейства из «Песни льда и огня»» . Датанами . 17 сентября 2020 г. Проверено 8 июня 2022 г.
  8. ^ Питер, Алекс. «Веб-скрапинг» . Проверено 28 марта 2021 г.
  9. ^ «Diffbot собирает 2 миллиона долларов, чтобы помочь приложениям понять открытую, неструктурированную сеть» . TheVerge. 31 мая 2012 года . Проверено 14 марта 2013 г.
  10. ^ «Diffbot превосходит Google Knowledge Graph для удовлетворения потребности в структурированных данных» . Форбс . 4 июня 2015 г. Проверено 15 июня 2015 г.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 17d6f0e9bd56d8b7587861160f721ec7__1711100880
URL1:https://arc.ask3.ru/arc/aa/17/c7/17d6f0e9bd56d8b7587861160f721ec7.html
Заголовок, (Title) документа по адресу, URL1:
Diffbot - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)