Папки
Эта статья нуждается в дополнительных цитатах для проверки . ( июнь 2012 г. ) |
Classora — это база знаний для Интернета, ориентированная на анализ данных . С практической точки зрения Classora представляет собой цифровой репозиторий , хранящий структурированную информацию и позволяющий отображать ее в нескольких форматах: аналитическом, графическом, географическом (через карты); а также проводить OLAP- анализ. Информация, содержащаяся в Classora, взята из открытых источников. [1] и загружается в систему через ботов и ETL- процессы. База знаний имеет коммерческий API. [2] для семантического улучшения и открытой сети [3] посредством которого любой пользователь может получить доступ к части собранной информации (он также позволяет пользователям дополнять данные и обмениваться мнениями).
Внутри Classora разделена на блоки знаний и отчеты . «Единица Знаний» — любой элемент Мира, о котором информация может храниться и представляться в виде таблицы данных (человек, компания, страна и т.д.). «Отчет» — это группа Единиц Знаний: рейтинг компаний, таблица спортивной классификации, опрос людей и т. д. Фактически, одна из технических возможностей Classora заключается в том, что она позволяет сравнивать отчеты и единицы знаний, собранные из разных источников, создавая тем самым дополнительную ценность для средства массовой информации, в которых публикуется данная информация: цифровые СМИ, интерактивное телевидение и т. д.
Ключевые определения
[ редактировать ]Блок знаний
[ редактировать ]Единицы знаний (также известные как записи ) в Classora — это таблицы данных, имеющие определенную семантическую эквивалентность статьям в Википедии: они хранят информацию о любом элементе мира, будь то фильм, страна, компания или животное. Однако они отличаются от Википедии тем, что Classora хранит структурированную информацию, обогащенную слоем метаданных; и поэтому он способен автоматически интерпретировать смысл каждой единицы знания.
Отчет данных
[ редактировать ]Отчет – это группа единиц знаний , в которой не допускается повторение элементов. Это определение включает в себя любой список, опрос, рейтинг и т. д.; и вообще любая консультация, которая включает в себя более одной единицы знаний. Classora превосходно справляется с управлением отчетами благодаря своим возможностям визуализации, способным отображать данные в виде таблиц, графиков и карт.
Виды отчетов:
- Спортивные результаты : результаты спортивных соревнований, санкционированные компетентным учреждением.
- Рейтинги и списки : все виды интересных и любопытных списков, независимо от того, имеют ли они неявный порядок или нет.
- Опросы : единицы знаний, ранжированные в соответствии с голосами пользователей.
- Запросы к базе знаний : Вопросы от пользователей, использующих CQL .
- Сети связей : автоматически рассчитываются на основе отчетов и таксономии каждой единицы знаний.
Организационная таксономия
[ редактировать ]( Организационная таксономия также называемая типом записи ) — это таблица данных, объединяющая общие атрибуты набора единиц знаний. Например, организационная таксономия «Драйвер F1» отображает такие атрибуты, как дата дебюта, команда и т. д.; а организационная таксономия «Футбольный клуб» представляет такие атрибуты, как город, стадион и т. д.
В Classora таксономии организованы иерархически, так что они наследуют атрибуты своих родительских таксономий. Например, F1 Driver — это вспомогательная таксономия Sportsperson , которая является вспомогательной таксономией Person , которая, в свою очередь, является вспомогательной таксономией Organism .
Самый простой тип записи в Classora — Classora Object . Все остальные таксономии являются ее дочерними структурами и наследуют ее атрибуты. Фактически, единственный атрибут, которым обладает объект Classora, — это имя (все единицы знаний должны иметь хотя бы одно имя).
Архитектура Классоры
[ редактировать ]Модуль извлечения данных
[ редактировать ]Модуль извлечения данных состоит из набора роботов, координируемых программным обеспечением, которое также управляет потенциальными инцидентами. Большая часть информации, доступной в Classora, автоматически загружается через этих роботов, которые подключаются к основным общедоступным онлайн-источникам для сбора всех типов данных. Существует три категории роботов:
- Роботы-экстракторы : отвечают за массовую загрузку отчетов из официальных общедоступных источников (ФИФА, ЦРУ, МВФ, Евростат...). Они используются для абсолютной или инкрементной загрузки данных.
- Роботы-сканеры данных : отвечают за поиск и обновление данных единицы знаний. Для выполнения этой задачи они используют конкретные источники: Википедию, IMDB, Всемирный банк и т. д.
- Агрегаторы контента : они не подключаются к внешним источникам. Вместо этого они генерируют новую информацию, используя внутреннюю базу данных Classora.
Совместный модуль
[ редактировать ]Пользователи Интернета могут участвовать в открытом веб-сайте Classora, предоставляя свои знания так же, как в Википедии. Существуют разные способы участия: добавление или исправление данных в Базе знаний, голосование в опросах (совместные рейтинги) и создание новых блоков знаний и отчетов с данными.
Модуль подключения
[ редактировать ]База знаний предназначена для встраивания в мультиплатформенные, многоканальные системы, что обеспечивает возможность ее интеграции в мобильные устройства, планшеты, интерактивное телевидение и т.п. Такая интеграция может осуществляться через специальные плагины (для навигаторов или других устройств) или API , REST который предоставляет контент в форматах XML или JSON . API разделен на три блока операций. Первый — это блок общих служебных инструментов (начиная от компонентов автопредложения о географических иерархиях до операций по получению списка сегодняшних дней рождения знаменитостей с использованием CQL ). Второй — блок операций по формированию виджетов (графиков, карт, рейтингов) с использованием информации из базы знаний. Наконец, существует блок операций, предназначенный для публикации бесплатного контента . [4]
Статистика проекта
[ редактировать ]По состоянию на апрель 2012 года в Classora было добавлено 2 000 000 единиц знаний, 15 000 отчетов, около 10 000 карт и несколько миллионов потенциальных сравнительных анализов. Согласно сайту веб-метрики Alexa, Classora Open Website занимает 100 557 место в мире и 2880 место в рейтинге трафика Испании. [5] Пользователи проводят в Classora в среднем 9,5 минут.
Внешние ссылки
[ редактировать ]Ссылки
[ редактировать ]- ^ Интервью в журнале R Technological Magazine (испанский)
- ^ API Classora в официальном блоге
- ^ «Открытая веб-база знаний Classora» . Архивировано из оригинала 28 августа 2019 г. Проверено 23 июля 2020 г.
- ^ Сообщение об API в официальном блоге Classora.
- ^ «Метрики Alexa для Classora Open Web» . Архивировано из оригинала 05 марта 2016 г. Проверено 11 июня 2012 г.