Викиданные
Скриншот | |
Тип сайта | |
---|---|
Доступно в | Несколько языков |
Владелец | Фонд Викимедиа |
Редактор | Сообщество Викимедиа |
URL-адрес | викиданные |
Коммерческий | Нет |
Регистрация | Необязательный |
Запущен | 29 октября 2012 г [1] |
Викиданные — это совместно редактируемый многоязычный график знаний , размещенный Фондом Викимедиа . [2] Это общий источник открытых данных как Arc.Ask3.Ru . , которые создают такие проекты Викимедиа , [3] [4] и любой другой может использовать лицензию CC0 общественного достояния . Wikidata — это вики, работающая на базе программного обеспечения MediaWiki , включая его расширение для полуструктурированных данных — Wikibase . По состоянию на начало 2023 года в Викиданных было 1,54 миллиарда описаний элементов ( семантическая тройка ). [5]
Концепция [ править ]
Викиданные — это документально-ориентированная база данных , в которой основное внимание уделяется элементам, представляющим любую тему, концепцию или объект. Каждому элементу присваивается уникальный постоянный идентификатор — положительное целое число с префиксом заглавной буквы Q, известное как «QID». Q — начальная буква имени Камарнисо Врандечича (урожденная Исмоилова), узбекского викимедиа, женатого на соразработчике Викиданных Денни Врандечиче . [6] Это позволяет перевести основную информацию, необходимую для определения темы, охватываемой элементом, без предпочтения какого-либо языка.
Примеры предметов: Летние Олимпийские игры 1988 года (Q8470) , любовь (Q316) , Джонни Кэш (Q42775) , Элвис Пресли (Q303) и Горилла (Q36611) .
Метки элементов не обязательно должны быть уникальными. Например, есть два предмета с названием «Элвис Пресли»: Элвис Пресли (Q303) , который представляет американского певца и актера , и Элвис Пресли (Q610926) , который представляет его одноименный альбом . Однако сочетание метки и ее описания должно быть уникальным. Чтобы избежать двусмысленности, уникальный идентификатор элемента ( QID ) связан с этой комбинацией.
Основные части [ править ]
По сути, предмет состоит из:
- Идентификатор . (QID), связанный с меткой и описанием
- Необязательно, несколько псевдонимов и некоторое количество операторов (а также их свойств и значений).
Заявления [ править ]
Утверждения — это то, как любая информация, известная об объекте, записывается в Викиданные. Формально они состоят из пар ключ-значение , которые сопоставляют свойство (например, «автор» или «дата публикации») с одним или несколькими значениями сущности (например, « Сэр Артур Конан Дойл » или «1902»). Например, неформальное английское утверждение «молоко белое» будет закодировано оператором, объединяющим свойство « цвет» (P462) со значением «белый» (Q23444) под элементом «молоко» (Q8495) .
Операторы могут сопоставлять свойство более чем с одним значением. Например, свойство «профессия» Марии Кюри могло быть связано с ценностями «физик» и «химик», чтобы отразить тот факт, что она занималась обеими профессиями. [7]
Значения могут принимать разные типы, включая другие элементы Викиданных, строки, числа или медиафайлы. Свойства предписывают, с какими типами значений они могут быть связаны. Например, официальный веб-сайт объекта недвижимости (P856) может быть связан только со значениями типа «URL». [8]
При желании можно использовать квалификаторы для уточнения значения утверждения путем предоставления дополнительной информации. Например, оператор «население» может быть изменен с помощью квалификатора, такого как «момент времени (P585): 2011» (в качестве собственной пары ключ-значение). Значения в операторах также могут быть помечены ссылками , указывающими на источник, поддерживающий содержимое оператора. [9] Как и в случае с операторами, все квалификаторы и ссылки представляют собой пары свойство-значение.
Свойства [ править ]
Каждое свойство имеет числовой идентификатор с префиксом заглавной буквы P и страницу в Викиданных с необязательной меткой, описанием, псевдонимами и утверждениями. Таким образом, существуют свойства, единственной целью которых является описание других свойств, например подсвойство (P1647) .
Свойства также могут определять более сложные правила их предполагаемого использования, называемые ограничениями . Например, свойство « столица » (P36) включает «ограничение одного значения», отражающее тот факт, что (обычно) территории имеют только одну столицу. Ограничения рассматриваются как предупреждения и подсказки при тестировании, а не как незыблемые правила. [10]
Прежде чем будет создан новый объект недвижимости, он должен пройти процесс обсуждения. [11] [12]
Наиболее используемое свойство — цитирует работу (P2860) , которое по состоянию на ноябрь 2023 года используется на более чем 290 000 000 страницах элементов. [update][13]
Лексемы [ править ]
В лингвистике лексема – это единица лексического значения. Викиданных Точно так же лексемы представляют собой элементы, структура которых делает их более подходящими для хранения лексикографических данных. Помимо хранения языка, к которому относится лексема, у них есть раздел для форм и раздел для значений . [14]
Схемы сущностей [ править ]
В январе 2019 года началась разработка нового расширения для MediaWiki, позволяющего хранить выражения формы в отдельном пространстве имен. [15] [16]
Это расширение с тех пор было установлено в Викиданных. [17] и позволяет участникам использовать выражения формы для проверки и описания данных Resource Description Framework в элементах и лексемах. Любой элемент или лексема в Викиданных может быть проверена на соответствие Entity Schema. [ нужны разъяснения ] и это делает его важным инструментом обеспечения качества.
Содержание [ править ]
Коллекции контента Викиданных включают данные биографий, [18] лекарство, [19] цифровые гуманитарные науки, [20] научные метаданные через проект WikiCite. [21]
Он включает в себя коллекции данных из других открытых проектов, включая Freebase (база данных) . [22]
Развитие [ править ]
Создание проекта финансировалось за счет пожертвований Института искусственного интеллекта Аллена , Фонда Гордона и Бетти Мур и Google, Inc. на общую сумму евро . 1,3 миллиона [23] [24] Развитие проекта в основном осуществляется Wikimedia Deutschland под руководством Лидии Пинчер и изначально было разделено на три этапа: [25]
- Централизация межъязыковых ссылок – связей между статьями Википедии по одной и той же теме на разных языках.
- Обеспечение центрального места для данных информационных боксов для всех Википедий.
- Создание и обновление статей списка на основе данных Викиданных и ссылок на другие дочерние проекты Викимедиа, включая Мета-Вики и собственные Викиданные (интервики-ссылки).
Первоначальное внедрение [ править ]
Викиданные были запущены 29 октября 2012 года и стали первым новым проектом Фонда Викимедиа с 2006 года. [3] [26] [27] В это время была доступна только централизация языковых связей. Это позволило создавать элементы и наполнять их основной информацией: метка — имя или заголовок, псевдонимы — альтернативные термины для метки, описание и ссылки на статьи по теме во всех языковых изданиях Википедии (ссылки на интервикипедию). .
Исторически статья в Википедии включала список межъязыковых ссылок (ссылки на статьи по той же теме в других выпусках Википедии, если они существовали). Викиданные изначально представляли собой автономное хранилище межъязыковых ссылок. [28] Языковые издания Википедии по-прежнему не имели доступа к Викиданным, поэтому им приходилось продолжать вести собственные списки межъязыковых ссылок. [ нужна ссылка ]
14 января 2013 года Венгерская Arc.Ask3.Ru стала первой, которая позволила предоставлять межъязыковые ссылки через Викиданные. [29] Эта функциональность была распространена на еврейскую и итальянскую Википедии 30 января, на английскую Википедию 13 февраля и на все остальные Википедии 6 марта. [30] [31] [32] [33] После того, как не было достигнуто консенсуса по предложению ограничить удаление языковых ссылок из английской Википедии, [34] они были автоматически удалены ботами . 23 сентября 2013 года на Wikimedia Commons появились межъязыковые ссылки. [35]
и доступ данным к Заявления
4 февраля 2013 г. в записи Викиданных были внесены утверждения. Возможные значения свойств изначально были ограничены двумя типами данных (элементы и изображения на Wikimedia Commons), а дополнительные типы данных (например, координаты позже появятся и даты). Первый новый тип, струнный, был развернут 6 марта. [36]
Возможность доступа к данным Викиданных для различных языковых изданий Википедии постепенно предоставлялась в период с 27 марта по 25 апреля 2013 года. [37] [38] 16 сентября 2015 года Викиданные начали разрешать так называемый произвольный доступ или доступ из данной статьи Википедии к утверждениям об элементах Викиданных, не связанных с ней напрямую. Например, из берлинской статьи стало возможным читать данные о Германии, что раньше было невозможно. [39] 27 апреля 2016 г. на Wikimedia Commons был активирован произвольный доступ. [40]
Согласно исследованию 2020 года, большая часть данных в Викиданных состоит из записей, массово импортированных из других баз данных интернет-ботами , что помогает «разрушить стены» хранилищ данных . [41]
Служба запросов и другие улучшения [ править ]
7 сентября 2015 года Фонд Викимедиа объявил о выпуске Службы запросов Викиданных. [42] который позволяет пользователям выполнять запросы к данным, содержащимся в Викиданных. [43] служба использует SPARQL В качестве языка запросов . По состоянию на ноябрь 2018 года существует как минимум 26 различных инструментов, позволяющих запрашивать данные разными способами. [44] используется Blazegraph В качестве базы данных тройного хранилища и графовой базы данных . [45] [46]
В 2021 году Wikimedia Deutschland выпустила Query Builder, [47] «построитель запросов на основе форм, позволяющий людям, не знающим, как использовать SPARQL», написать запрос.
Логотип [ править ]
Полоски логотипа содержат слово «WIKI», закодированное азбукой Морзе . [48] Он был создан Аруном Ганешем и выбран решением сообщества. [49]
Прием [ править ]
В ноябре 2014 года Викиданные получили Премию издателя открытых данных от Института открытых данных «за огромный масштаб и встроенную открытость». [50]
В декабре 2014 года Google объявила, что закроет Freebase в пользу Викиданных. [51]
По состоянию на ноябрь 2018 г. [update]Информация Викиданных использовалась в 58,4% всех статей англоязычной Википедии, в основном для внешних идентификаторов или координат местоположений. В совокупности данные из Викиданных показаны на 64% всех страниц Википедии , 93% всех статей Викивояжа , 34% всех Викицитатов , 32% всех Викиисточников и 27% всех Wikimedia Commons. [52]
По состоянию на декабрь 2020 г. [update], данные Викиданных были визуализированы как минимум 20 другими внешними инструментами. [53] о Викиданных было опубликовано более 300 статей. [54]
Приложения [ править ]
- Структурированный набор данных Викиданных использовался виртуальными помощниками , такими как Apple Siri и Amazon Alexa . [55]
- Расширение Mwnci может импортировать данные из Викиданных в LibreOffice Calc. электронные таблицы [56]
- KDE Itinerary — туристический помощник с открытым исходным кодом, заботящийся о конфиденциальности и использующий данные из Викиданных. [57]
- Первоначально Google запустил проект семантического анализатора фреймов , целью которого является анализ информации в Википедии и передача ее в Викиданные путем создания соответствующих утверждений с использованием искусственного интеллекта . [58]
- MathQA - ответов на математические вопросы. система [59]
В 2019 году был проведен систематический обзор литературы по использованию Викиданных в исследованиях. [60]
См. также [ править ]
Ссылки [ править ]
- ^ «Революция Викиданных уже здесь: создание структурированных данных в Википедии» . 25 апреля 2013 года . Проверено 12 июня 2022 г.
С момента запуска Wikidata.org 30 октября 2012 г.
- ^ Чалаби, Мона (26 апреля 2013 г.). «Добро пожаловать в Викиданные! Что теперь?» . Архивировано из оригинала 2 октября 2021 года . Проверено 2 октября 2021 г.
- ↑ Перейти обратно: Перейти обратно: а б Викиданные ( Архивировано 29 октября 2012 г. в Wayback Machine )
- ^ «Информационная революция для Википедии» . Викимедиа Германия. 30 марта 2012 г. Архивировано из оригинала 23 октября 2012 г. Проверено 11 сентября 2012 г.
- ^ «Графана» . grafana.wikimedia.org . Проверено 21 марта 2024 г.
- ^ Врандечич, Денни; Пинчер, Лидия; Креч, Маркус (30 апреля 2023 г.). «Викиданные: Создание» . Сопутствующие материалы веб-конференции ACM 2023 . стр. 615–624. дои : 10.1145/3543873.3585579 . ISBN 9781450394192 . S2CID 258377705 .
- ^ «Справка:Заявления – Викиданные» . www.wikidata.org . Архивировано из оригинала 25 марта 2019 года . Проверено 20 февраля 2019 г.
- ^ «Справка:Тип данных – Викиданные» . www.wikidata.org . Архивировано из оригинала 23 марта 2019 года . Проверено 20 февраля 2019 г.
- ^ «Справка:Источники – Викиданные» . www.wikidata.org . Архивировано из оригинала 17 апреля 2019 года . Проверено 20 февраля 2019 г.
- ^ «Справка:Портал ограничений свойств» . Викиданные . Архивировано из оригинала 1 июня 2019 года . Проверено 20 февраля 2019 г.
- ^ Кокрейн, Юан (30 сентября 2016 г.). «Викиданные как база знаний по цифровому сохранению» . openpreservation.org . Архивировано из оригинала 5 января 2022 года . Проверено 5 января 2022 г.
- ^ Сэмюэл, Джон (15 августа 2018 г.). «Экспериментальный МО сочетает многоязычие, мультимодальность и взаимодействие». Экспериментальный МО сочетает многоязычие, мультимодальность и взаимодействие . CLEF 2018. Конспекты лекций по информатике. Том. 11018. с. 129. дои : 10.1007/978-3-319-98932-7_12 . ISBN 978-3-319-98931-0 .
- ^ «Викиданные:Отчеты базы данных/Список объектов/Топ100» . Архивировано из оригинала 24 февраля 2023 года . Проверено 18 ноября 2023 г.
- ^ «Викиданные:Лексикографические данные/Документация – Викиданные» . www.wikidata.org . Архивировано из оригинала 13 ноября 2018 года . Проверено 13 ноября 2018 г.
- ^ «Расширение:EntitySchema – MediaWiki» . mediawiki.org . Архивировано из оригинала 25 июня 2021 года . Проверено 10 сентября 2021 г.
- ^ «Начальный пустой репозиторий» . Геррит . 15 января 2019 года. Архивировано из оригинала 19 марта 2022 года . Проверено 12 июня 2022 г.
- ^ «Версия – Викиданные» . Wikidata.org . Архивировано из оригинала 19 октября 2021 года . Проверено 10 сентября 2021 г.
- ^ Чисхолм, Эндрю; Рэдфорд, Уилл; Хачи, Бен (2017). «Учимся создавать биографии из одного предложения на основе Викиданных». arXiv : 1702.06235 .
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ^ Турция, Хаумеддин; Шафи, Томас; Хадж Тайеб, Мохаммед Али; Бен Ауиша, Мохаммед; Врандечич, Денни; Дас, Диптация; Хамди, Хельми (ноябрь 2019 г.). «Викиданные: крупномасштабная совместная онтологическая медицинская база данных » Журнал биомедицинской информатики . / j.jbi.2019.103292 дои : 10.1016 .
- ^ Чжао, Фуди (31 мая 2023 г.). «Систематический обзор Викиданных в проектах цифровых гуманитарных наук» . Цифровая стипендия в области гуманитарных наук . 38 (2): 852–874. дои : 10.1093/llc/fqac083 .
- ^ Нильсен, Финн Аруп; Митчен, Дэниел; Уиллигхаген, Эгон (2017). Схолия, наукометрия и Викиданные (PDF) . Конспекты лекций по информатике. Том 10577. С. 237–259. дои : 10.1007/978-3-319-70407-4_36 . ISBN 978-3-319-70406-7 .
{{cite book}}
:|journal=
игнорируется ( помогите ) - ^ Пеллиссье Танон, Томас; Врандечич, Денни; Шафферт, Себастьян; Штайнер, Томас; Пинчер, Лидия (11 апреля 2016 г.). «От Freebase к Викиданным: Великая миграция»: 1419–1428 гг. дои : 10.1145/2872427.2874809 .
{{cite journal}}
: Для цитирования журнала требуется|journal=
( помощь ) - ^ Дикинсон, Бунсри (30 марта 2012 г.). «Пол Аллен инвестирует в масштабный проект по улучшению Википедии» . Бизнес-инсайдер . Архивировано из оригинала 23 декабря 2017 года . Проверено 11 сентября 2012 г.
- ^ Перес, Сара (30 марта 2012 г.). «Следующее большое достижение Википедии: Викиданные, машиночитаемая и редактируемая пользователем база данных, финансируемая Google, Полом Алленом и другими» . ТехКранч . Архивировано из оригинала 5 октября 2012 года . Проверено 11 сентября 2012 г.
- ^ «Викиданные – Мета» . мета.викимедиа.орг . Архивировано из оригинала 7 апреля 2012 года . Проверено 8 ноября 2015 г.
- ^ Пинчер, Лидия (30 октября 2012 г.). «wikidata.org работает (с некоторыми оговорками)» . wikidata-l (список рассылки) . Проверено 3 ноября 2012 г.
- ^ Рот, Мэтью (30 марта 2012 г.). «Революция данных в Википедии» . Фонд Викимедиа. Архивировано из оригинала 31 июля 2020 года . Проверено 11 сентября 2012 г.
- ^ Лейтч, Томас (1 ноября 2014 г.). Wikipedia U: Знания, авторитет и гуманитарное образование в эпоху цифровых технологий . Издательство Университета Джонса Хопкинса . п. 120 . ISBN 978-1-4214-1550-5 .
- ^ Пинчер, Лидия (14 января 2013 г.). «Первые шаги Викиданных в венгерской Википедии» . Викимедиа Германия. Архивировано из оригинала 14 декабря 2015 года . Проверено 17 декабря 2015 г.
- ^ Пинчер, Лидия (30 января 2013 г.). «Викиданные появятся в следующих двух Arc.Ask3.Ruх» . Викимедиа Германия. Архивировано из оригинала 4 октября 2018 года . Проверено 31 января 2013 г.
- ^ Пинчер, Лидия (13 февраля 2013 г.). «Викиданные живут в английской Википедии» . Викимедиа Германия. Архивировано из оригинала 19 февраля 2013 года . Проверено 15 февраля 2013 г.
- ^ Пинчер, Лидия (6 марта 2013 г.). «Викиданные теперь живут во всех Arc.Ask3.Ruх» . Викимедиа Германия. Архивировано из оригинала 14 апреля 2013 года . Проверено 8 марта 2013 г.
- ^ «Викиданные есть для всех Википедий» (на немецком языке). Golem.de. Архивировано из оригинала 6 ноября 2018 года . Проверено 29 января 2014 г.
- ^ «Обсуждение в Википедии: Интервики Викиданных RFC » 29 марта 2013 г. Архивировано из оригинала 18 октября. Получено 30 марта.
- ^ Пинчер, Лидия (23 сентября 2013 г.). «Викиданные здесь!» . Commons: Деревенский насос . Архивировано из оригинала 6 декабря 2021 года . Проверено 30 августа 2016 г.
- ^ Пинчер, Лидия. 2 «Викиданные/Обновления статуса / Викимедиа Мета- Вики Фонд Викимедиа. Архивировано из оригинала 12 апреля. Получено 3 марта.
- ^ Пинчер, Лидия (27 марта 2013 г.). «Вы можете получить все данные!» . Викимедиа Германия. Архивировано из оригинала 29 марта 2013 года . Проверено 28 марта 2013 г.
- ^ «Викиданные доступны по всему миру» . H. 25 апреля 2013 г. Архивировано из оригинала 1 января 2014 г.
- ^ Пинчер, Лидия (16 сентября 2015 г.). «Викиданные: доступ к данным из произвольных элементов здесь» . Arc.Ask3.Ru: Деревенский насос (технический) . Архивировано из оригинала 27 сентября 2016 года . Проверено 30 августа 2016 г.
- ^ Пинчер, Лидия (27 апреля 2016 г.). «Поддержка Викиданных: произвольный доступ здесь» . Commons: Деревенский насос . Архивировано из оригинала 5 февраля 2017 года . Проверено 30 августа 2016 г.
- ^ Ваагмеестер, Андра; Ступп, Грегори; Бургшталлер-Мюльбахер, Себастьян; и др. (17 марта 2020 г.). «Викиданные как граф знаний для наук о жизни» . электронная жизнь . 9 . дои : 10.7554/ELIFE.52614 . ISSN 2050-084X . ПМК 7077981 . ПМИД 32180547 . Викиданные Q87830400 .
- ^ "Дом" . query.wikidata.org . Архивировано из оригинала 7 ноября 2016 года . Проверено 30 января 2019 г.
- ^ «[Викиданные] Объявляем о выпуске Службы запросов Викиданных — Викиданные — lists.wikimedia.org » Архивировано 10 ноября. из оригинала Получено 13 ноября.
- ^ «Викиданные:Инструменты/Данные запроса – Викиданные» . www.wikidata.org . Архивировано из оригинала 31 мая 2020 года . Проверено 13 ноября 2018 г.
- ^ «[Wikidata-tech] Обновление серверной части запросов Викиданных (возьмите два!)» . lists.wikimedia.org . Архивировано из оригинала 6 января 2021 года . Проверено 29 августа 2018 г. . (В сообщении также содержится ссылка на сравнение графовых баз данных, выполненное Wikimedia.)
- ^ 86 на GitHub
- ^ «Построитель запросов к Викиданным» . query.wikidata.org .
- ^ Commons: Обсуждение файла: Wikidata-logo-en.svg# Гибрид Проверено 6 октября 2016 г.
- ^ «Und der Gewinner ist...» 13 июля 2012 г. Архивировано из оригинала 21 января 2021 г. . Проверено 16 июня 2020 г.
- ^ «Первая премия ODI за открытые данные, врученная сэрами Тимом Бернерсом-Ли и Найджелом Шедболтом» . Архивировано из оригинала 24 марта 2016 года.
- ^ «Фрибаза» . Гугл Плюс . 16 декабря 2014 г. Архивировано из оригинала 20 марта 2019 г.
- ^ «Процент статей, использующих данные из Викиданных» . Архивировано из оригинала 15 ноября 2018 года . Проверено 15 ноября 2018 г.
- ^ «Викиданные:Инструменты/Визуализация данных – Викиданные» . www.wikidata.org . Архивировано из оригинала 15 ноября 2018 года . Проверено 15 ноября 2018 г.
- ^ «Шолия» . Схолия . Архивировано из оригинала 30 сентября 2021 года . Проверено 2 августа 2021 г.
- ^ Симоните, Том (18 февраля 2019 г.). «Внутри дружественного к Alexa мира Викиданных» . Проводной . ISSN 1059-1028 . Проверено 25 декабря 2020 г.
- ^ «Роб Барри / Mwnci – Глубокие электронные таблицы» . ГитЛаб . Архивировано из оригинала 21 сентября 2019 года . Проверено 21 сентября 2019 г.
- ^ Краузе, Волкер (12 января 2020 г.), KDE Itinerary - Помощник по путешествиям, созданный по принципу конфиденциальности , заархивировано из оригинала 26 июня 2020 г. , получено 10 ноября 2020 г.
- ^ слинг на GitHub
- ^ Шарпф, П. Шуботц, М. Гипп, Б. Анализ математических документов для ответов на вопросы с помощью неконтролируемой маркировки формул. Архивировано 10 февраля 2023 г. на совместной конференции Wayback Machine ACM/IEEE по цифровым библиотекам, 2022 г.
- ^ Мора-Канталопс, Маршал; Санчес-Алонсо, Сальвадор; Гарсиа-Барриоканал, Елена (2 сентября 2019 г.). «Систематический обзор литературы по Викиданным». Технологии обработки данных и приложения . 53 (3): 250–268. дои : 10.1108/DTA-12-2018-0110 . S2CID 202036639 .
Дальнейшее чтение [ править ]
- Марк Грэм (6 апреля 2012 г.), «Проблема с Викиданными» , The Atlantic , США.
- Клаудия Мюллер-Бирн, Бенджамин Карран, Джанетт Леманн, Маркус Люзак-Рёш: Система коллегиального производства или совместная разработка онтологий: что такое Викиданные? In, OpenSym 2015 – Конференция по открытому сотрудничеству, Сан-Франциско, США, 19–21 августа 2015 г. (препринт).
Внешние ссылки [ править ]
- Официальный сайт
- Видео: WikidataCon на media.ccc.de
- Построитель запросов Викиданных