ДАННЫЕ COMMONS
![]() | |
![]() Results for a query in Data Commons | |
Founder(s) | Ramanathan V. Guha |
---|---|
Parent | |
URL | datacommons |
Launched | May 2018 |
Data Commons -это платформа с открытым исходным кодом [ 1 ] Создано Google [ 2 ] Это обеспечивает открытый график знаний , объединяющий экономические, научные и другие публичные наборы данных в единый взгляд. [ 3 ] Раманатан В. Гуха , создатель веб -стандартов, включая RDF , [ 4 ] Rss и schema.org , [ 5 ] основал проект. [ 6 ]
Веб-сайт Data Commons был запущен в мае 2018 года с первоначальным набором данных, состоящим из по проверке фактов, данных опубликованных в формате Schema.org "Treatreview" несколькими проверками фактов из международной сети проверки фактов . [ 7 ] [ 8 ] Google работал с такими партнерами, как Организация Объединенных Наций (ООН), чтобы заполнить репозиторий, [ 2 ] который также включает данные переписи Соединенных Штатов , Всемирный банк , Бюро статистики труда США , [ 9 ] Arc.Ask3.Ru , Национальная администрация океанических и атмосферных ресурсов и Федеральное бюро расследований . [ 10 ]
Служба расширилась в течение 2019 года, чтобы включить в стиле RDF, график знаний заполненный рядом в значительной степени статистические открытые наборы данных. Служба была объявлена более широкой аудитории в 2019 году. [ 11 ] В 2020 году сервис улучшила охват неамериканских наборов данных, а также увеличила охват биоинформатикой и коронавируса . [ 12 ] В 2023 году сервис перезарядился с помощью естественного фронтального фронта, основанного на большой языковой модели . [ 2 ] Он также был запущен в качестве заднего конец портала данных ООН с данными целей устойчивого развития . [13]
Features
[edit]Data Commons places more emphasis on statistical data than is common for linked data and knowledge graph initiatives. It includes geographical, demographic, weather and real estate data alongside other categories,[3] describing states, Congressional districts, and cities in the United States as well as biological specimens, power plants, and elements of the human genome via the Encyclopedia of DNA Elements (ENCODE) project.[10] It represents data as semantic triples each of which can have its own provenance.[3] It centers on the entity-oriented integration of statistical observations from a variety of public datasets. Although it supports a subset of the W3C SPARQL query language,[14] its APIs[15] also include tools — such as a Pandas dataframe interface — oriented towards data science, statistics and data visualization.
Data Commons is integrative, meaning that, rather than providing a hosting platform for diverse datasets, it attempts to consolidate much of the information the datasets provide into a single data graph.
Technology
[edit]Data Commons is built on a graph data-model. The graph can be accessed through a browser interface and several APIs,[3][10] and is expanded through loading data (typically CSV and MCF-based templates).[16] The graph can be accessed by natural language queries in Google Search.[17] The data vocabulary used to define the datacommons.org graph is based upon Schema.org.[3] In particular the Schema.org terms StatisticalPopulation[18] and Observation[19] were proposed to Schema.org to support datacommons-like usecases.[20]
Software from the project is available on GitHub under Apache 2 license.[21]
References
[edit]- ^ "Custom Data Commons". Docs - Data Commons. Retrieved 16 July 2024.
- ^ Jump up to: a b c "Data Commons is using AI to make the world's public data more accessible and helpful". Google. 13 September 2023. Retrieved 16 July 2024.
- ^ Jump up to: a b c d e Fensel, Dieter; Şimşek, Umutcan; Angele, Kevin; Huaman, Elwin; Kärle, Elias; Panasiuk, Oleksandra; Toma, Ioan; Umbrich, Jürgen; Wahler, Alexander (2020), "Introduction: What Is a Knowledge Graph?", Knowledge Graphs, Cham: Springer International Publishing, pp. 1–10, doi:10.1007/978-3-030-37439-6_1, ISBN 978-3-030-37438-9, S2CID 213620389, retrieved 2020-10-16
- ^ Guns, Raf (2013). "Tracing the origins of the semantic web". Journal of the American Society for Information Science and Technology. 64 (10): 2173–2181. doi:10.1002/asi.22907. hdl:10067/1111170151162165141.
- ^ Funke, Daniel (7 December 2017). "This website helps you find related fact checks - and it was built by a 17-year-old". Poynter. Retrieved 16 July 2024.
- ^ Guha, Ramanathan V. (15 October 2020). "Data Commons, now accessible on Google Search". docs.datacommons.org. Retrieved 2020-10-16.
- ^ "Fact Checks". datacommons.org. 29 March 2019. Retrieved 14 October 2020.
- ^ Jiang, Shan; Baumgartner, Simon; Ittycheriah, Abe; Yu, Cong (2020-04-20). "Factoring Fact-Checks: Structured Information Extraction from Fact-Checking Articles". Proceedings of the Web Conference 2020. WWW '20. Taipei Taiwan: ACM. pp. 1592–1603. doi:10.1145/3366423.3380231. ISBN 978-1-4503-7023-3. S2CID 215882520.
- ^ Raghavan, Prabhakar (2020-10-15). "How AI is powering a more helpful Google". Google. Retrieved 2020-10-16.
- ^ Jump up to: a b c Sheth, Amit; Padhee, Swati; Gyrard, Amelie; Sheth, Amit (2019-07-01). "Knowledge Graphs and Knowledge Networks: The Story in Brief". IEEE Internet Computing. 23 (4): 67–75. arXiv:2003.03623. doi:10.1109/MIC.2019.2928449. ISSN 1089-7801. S2CID 204820800.
- ^ Luong, Daphne; Chou, Charina (5 March 2019). "Doing our part to share open data responsibly". The Keyword. Retrieved 14 October 2020.
- ^ Ramasubramanian, Sowmya (21 September 2020). "Google's open source data to study impact of COVID-19". The Hindu. Retrieved 14 October 2020.
- ^ Manyika, Джеймс (19 сентября 2023 г.). «Использование данных и ИИ для отслеживания прогресса в достижении глобальных целей ООН» . Google . Получено 22 июля 2024 года .
- ^ «Запросите график знаний Data Commons с использованием sparql» . DataCommons.org . Получено 14 октября 2020 года .
- ^ "Обзор" . DataCommons.org . Получено 14 октября 2020 года .
- ^ «Вклад в Data Commons - добавление наборов данных» . DataCommons.org . ДАННЫЕ COMMONS.
- ^ Гуха, Раманатан В. (15 октября 2020 г.). «Data Commons, теперь доступны в поиске Google» . docs.datacommons.org . Получено 2020-10-16 .
- ^ «Статистический тип типа на schema.org» . Schema.org . Получено 14 октября 2020 года .
- ^ «Тип наблюдения на schema.org» . Schema.org . Получено 14 октября 2020 года .
- ^ «Предложение о представлении совокупных статистических данных» . GitHub - Schema.org Repository . 25 июня 2019 года . Получено 14 октября 2020 года .
- ^ "DATACOMMONS.ORG GITHUB" . GitHub .