Диффбот
![]() | |
Тип компании | Частная компания |
---|---|
Промышленность | Интернет |
Основатель | Майк Тунг |
Штаб-квартира | , НАС |
Обслуживаемая территория | По всему миру |
Ключевые люди |
|
Услуги | Веб-API , Корпоративный поиск , Парсинг веб-страниц , Сканирование веб-страниц |
Веб-сайт | www.diffbot.com |
Diffbot — разработчик алгоритмов машинного обучения и компьютерного зрения , а также общедоступных API для извлечения данных с веб-страниц и веб-скрапинга для создания базы знаний .
Компания привлекла интерес благодаря применению технологии компьютерного зрения к веб-страницам, при котором она визуально анализирует веб-страницу на наличие важных элементов и возвращает их в структурированном формате . [1] В 2015 году Diffbot объявил, что работает над своей версией автоматизированной « График знаний », сканируя Интернет и используя автоматическое извлечение веб-страниц для создания большой базы данных структурированных веб-данных. [2] В 2019 году Diffbot опубликовал свою диаграмму знаний, которая с тех пор выросла и включает более 2 миллиардов объектов (корпораций, людей, статей, продуктов, дискуссий и т. д.) и 10 триллионов «фактов».
Продукты компании позволяют разработчикам программного обеспечения анализировать домашние страницы веб-сайтов и страницы статей. [3] и извлечь «важную информацию», игнорируя элементы, которые не считаются ключевыми для основного контента. [4]
В августе 2012 года компания выпустила API-интерфейс классификатора страниц, который автоматически классифицирует веб-страницы по определенным «типам страниц». [5] В рамках этого Diffbot проанализировал 750 000 веб-страниц, опубликованных в социальной сети Twitter , и обнаружил, что фотографии, а затем статьи и видео являются преобладающими веб-медиа, публикуемыми в социальной сети. [6]
В сентябре 2020 года компания выпустила API обработки естественного языка для автоматического построения графиков знаний из текста. [7] [8] В мае 2012 года компания привлекла финансирование в размере 2 миллионов долларов от таких инвесторов, как Энди Бехтольшейм и Скай Дейтон . [9]
Клиентами Diffbot являются Adobe , AOL , Cisco , DuckDuckGo , eBay , Instapaper , Microsoft , Onswipe и Springpad . [4] [5] [10]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ «Diffbot позволяет разработчикам перемещаться по коду так, как наши глаза видят мир» . TheNextWeb. 25 августа 2011 года . Проверено 21 апреля 2013 г.
- ^ «Стартап выпускает клон Google Knowledge Graph » . Проводной. 4 июня 2015 г. Проверено 15 июня 2015 г.
- ^ «Diffbot помогает приложениям читать Интернет как люди» . ГигаОм. 25 августа 2011 года . Проверено 14 марта 2013 г.
- ^ Jump up to: а б «Инвесторы поддерживают робота визуального обучения Diffbot для веб-контента» . Уолл Стрит Джорнал. 31 мая 2012 года . Проверено 14 марта 2013 г.
- ^ Jump up to: а б «Новый API DiffBot блестяще показывает, что скрывается за любой ссылкой» . 16 августа 2012 года . Проверено 14 марта 2013 г.
- ^ «Твиттер: Один день из жизни» . Машаемый . 16 августа 2012 года . Проверено 14 марта 2013 г.
- ^ «Новый инструмент искусственного интеллекта отображает библейские семейства из «Песни льда и огня»» . Датанами . 17 сентября 2020 г. Проверено 8 июня 2022 г.
- ^ Питер, Алекс. «Веб-скрапинг» . Проверено 28 марта 2021 г.
- ^ «Diffbot собирает 2 миллиона долларов, чтобы помочь приложениям понять открытую, неструктурированную сеть» . TheVerge. 31 мая 2012 года . Проверено 14 марта 2013 г.
- ^ «Diffbot превосходит Google Knowledge Graph для удовлетворения потребности в структурированных данных» . Форбс . 4 июня 2015 г. Проверено 15 июня 2015 г.