График цитирования
Возможно, эту статью необходимо реорганизовать, чтобы она соответствовала рекомендациям Википедии по оформлению . ( январь 2021 г. ) |
Часть серии о |
Метрики цитирования |
---|
Граф цитирования (или сеть цитирования ) в информатике и библиометрии представляет собой ориентированный граф , описывающий цитирования в коллекции документов.
Каждая вершина (или node ) в графе представляет документ в коллекции, а каждое ребро направлено от одного документа к другому, который оно цитирует (или наоборот, в зависимости от конкретной реализации). [1]
Графики цитирования использовались различными способами, включая формы анализа цитирования , инструменты академического поиска и судебные решения . Прогнозируется, что в будущем они станут более актуальными и полезными по мере роста объема публикуемых исследований.
Реализация [ править ]
Не существует стандартного формата для цитат в библиографиях , а увязка записей цитат может оказаться трудоемким и сложным процессом. Более того, ошибки цитирования могут возникнуть на любом этапе процесса публикации. Однако существует долгая история создания баз данных цитирования, также известных как индексы цитирования , поэтому информации о подобных проблемах имеется много.
В принципе, каждый документ должен иметь уникальную дату публикации и может ссылаться только на более ранние документы. Это означает, что идеальный граф цитирования не только направлен, но и ацикличен ; то есть в графе нет петель. На практике это не всегда так, поскольку в процессе публикации научная статья претерпевает несколько версий. Выбор времени для асинхронного обновления библиографии может привести к появлению границ, которые, очевидно, указывают назад во времени. Такие «обратные» цитирования составляют менее 1% от общего количества ссылок. [2]
Поскольку ссылки на цитирование должны быть постоянными, основная часть графика цитирования должна быть статичной, и изменяться должен только передний край графика. Исключения могут возникнуть в случае изъятия бумаг из обращения. [2]
Предыстория и история [ править ]
Цитата — это ссылка на опубликованный или неопубликованный источник (не всегда первоисточник). Точнее, цитата – это сокращенное буквенно-цифровое выражение, встроенное в текст интеллектуального произведения, обозначающее запись в разделе «Библиографические ссылки» произведения. Его цель — признать актуальность чужих работ для темы обсуждения в тот момент, когда появляется цитирование .
Обычно комбинация внутренней цитаты и библиографической записи представляет собой то, что обычно называют цитатой (тогда как библиографические записи сами по себе таковыми не являются). [3] Ссылки на отдельные машиночитаемые утверждения в электронных научных статьях известны как нанопубликации — форма микроатрибуции .
Сети цитирования — это один из видов социальных сетей, который количественно изучается практически с того момента, как впервые стали доступны базы данных цитирования. В 1965 году Дерек Дж. де Солла Прайс описал внутреннюю связующую характеристику индекса научного цитирования (SCI) в своей статье, озаглавленной «Сети научных статей». Связи между цитированием и цитируемыми статьями стали динамичными, когда SCI начал публиковаться в Интернете. В 1973 году Генри Смолл опубликовал свою работу по анализу совместного цитирования, который стал самоорганизующейся системой классификации , которая привела к экспериментам по кластеризации документов и, в конечном итоге, к тому, что называется «Обзорами исследований». [4]
Приложения [ править ]
Анализ цитирования [ править ]
Графики цитирования можно применять для измерения научного воздействия , влияния конкретной статьи на академический мир. Хотя научное влияние сложно оценить количественно, оно полезно, поскольку измерение научного влияния многих статей может помочь в выявлении важных статей. Он также может обеспечить меру актуальности конкретного академического сообщества. Графики цитирования очень полезны для измерения этого показателя, поскольку количество связей на графике цитирования соответствует научному влиянию статьи, а это означает, что ее цитировали во многих других статьях. [5]
Анализ сходства — еще одна область анализа цитирования, в которой часто используются графики цитирования. Отношения между двумя статьями в графике цитирования сравнивались с их текстовым сходством , и было обнаружено, что близость в графе цитирования может предсказать уровень текстового сходства. [6] Кроме того, было обнаружено, что два метода — близость графа цитирования и традиционное сходство на основе содержания — хорошо работают в сочетании для получения более точного результата. [6]
Анализ графиков цитирования также привел к предложению графа цитирования как способа идентификации различных сообществ и областей исследований в академическом мире. Было обнаружено, что анализ графика цитирования для групп документов в сочетании с ключевыми словами может обеспечить точный способ выявления кластеров схожих исследований. [7] Аналогичным образом, способ определения основного «потока» области исследования или развития исследовательской идеи с течением времени можно определить с помощью алгоритмов поиска в глубину на графике цитирования. Вместо того, чтобы рассматривать сходство между двумя узлами или кластерами из многих узлов, этот метод вместо этого проходит через связи между узлами, чтобы проследить исследовательскую идею до ее начала и, таким образом, обнаружить ее развитие через разные статьи до ее текущего статуса. [8]
Инструменты поиска [ править ]
Традиционный метод, используемый инструментами академического поиска, заключается в проверке совпадений между поисковым термином и ключевыми словами в статьях для получения потенциальных совпадений. Хотя этот метод в целом эффективен, он может привести к ошибкам, когда рекомендуется статья из другой дисциплины из-за совпадения ключевых слов, даже если эти две темы на самом деле имеют мало общего.
Многие утверждают, что этот способ поиска соответствующих статей можно было бы улучшить и сделать более точным, если бы графики цитирования были включены в инструменты поиска научных статей. Например, была предложена одна система, в которой использовалась как система ключевых слов, так и система популярности, основанная на количестве связей статьи в графике цитирования. В этой системе более взаимосвязанные статьи считались более популярными и, следовательно, получали более высокий вес в системе рекомендаций статей. [9]
В последние годы были разработаны инструменты визуального поиска, которые используют графики цитирования для визуального представления связей между статьями. Заметным пионером в этой концепции является инструмент поиска Connected Papers, который начался как небольшой проект друзей и был опубликован для общественности в 2020 году. Учитывая одну научную статью, он анализирует десятки тысяч других статей и отбирает все те, которые имеют отношение к исходная статья создает график цитирования и возвращает его визуальное представление зрителю. Этот уникальный способ рассмотрения исследований позволяет зрителю сразу увидеть всю область исследований и может значительно помочь в понимании состояния области исследований и быстром выявлении ключевых статей, имеющих множество связей. [ нужна ссылка ]
Решения суда [ править ]
Графики цитирования уже давно используются для помощи в организации и сопоставлении цитирований юридических документов. Подобно вышеупомянутым инструментам поиска, конструкции графов цитирования, специфичные для типов цитат, обнаруженных в юридических документах, использовались, чтобы позволить находить соответствующие прошлые юридические документы, когда это необходимо для принятия решения суда. В качестве замены или улучшения традиционных методов поиска этот способ организации юридических документов с помощью графа цитирования может обеспечить более высокую эффективность, точность и организованность. [10]
Связанные сети [ править ]
Существует несколько других типов сетевых графов, тесно связанных с сетями цитирования. Граф совместного цитирования — это граф между документами как узлами, где два документа связаны, если они имеют общее цитирование (см. Совместное цитирование и библиографическая связь ). Другие связанные сети формируются с использованием другой информации, представленной в документе. Например, в графе сотрудничества , известном в этом контексте как сеть соавторства, узлы являются авторами документов, связанных, если они были соавторами одного и того же документа. Вес связей между двумя авторами в сетях соавторства может со временем увеличиться, если они будут продолжать сотрудничать.
Будущие разработки [ править ]
Хотя графики цитирования оказали заметное влияние на некоторые области научных кругов, они, вероятно, станут более актуальными в будущем. По мере роста объема опубликованных исследований более традиционные способы поиска статей станут менее эффективными для сужения соответствующих статей к определенной теме. Например, сходство на основе текста может зайти далеко только при выборе статей, имеющих отношение к теме, тогда как добавление графиков цитирования могло бы способствовать приданию более высокого приоритета тем статьям, которые имеют много связей с другими статьями, имеющими отношение к данной теме. тема.
Однако подобные разработки сталкиваются с теми же проблемами, что и большинство применений графиков цитирования, поскольку не существует стандартизированного формата или способа цитирования. Это очень затрудняет построение таких графиков, поскольку для извлечения цитат из статей требуется сложный программный анализ. Одним из предлагаемых решений этой проблемы является создание открытых баз данных с информацией о цитировании в формате, который мог бы использоваться кем угодно и легко конвертироваться в другую форму, например, в график цитирования. [11]
См. также [ править ]
- Граф сотрудничества — граф, определенный авторами документов.
- Веб-график — график цитирования ссылок с одной веб-страницы на другую во Всемирной паутине.
- Направленный ациклический граф — формальная математическая структура хорошо построенного графа цитирования.
- Анализ юридического цитирования Анализ цитирования в юридическом контексте
Ссылки [ править ]
- ^ Эгге, Лео; Руссо, Рональд (1990). Введение в информаметрику: количественные методы в библиотеке, документации и информатике . Амстердам, Нидерланды: Издательство Elsevier Science. п. 228. ИСБН 0-444-88493-9 .
- ^ Jump up to: Перейти обратно: а б Джеймс Р. Клаф; Джейми Голлингс; Тамар В. Лоуч; Тим С. Эванс (2015). «Транзитивное сокращение сетей цитирования». Журнал сложных сетей . 3 (2): 189–203. arXiv : 1310.8224 . дои : 10.1093/comnet/cnu039 . S2CID 10228152 .
- ^ Чжао, Данчжи; Стротманн, Андреас (01 февраля 2015 г.). Анализ и визуализация сетей цитирования . Издательство Морган и Клейпул. ISBN 978-1-60845-939-1 .
- ^ Структуры и статистика сетей цитирования, Мирай Кас
- ^ Жичковский, Кароль (01 октября 2010 г.). «График цитируемости, взвешенные импакт-факторы и индексы эффективности» . Наукометрия . 85 (1): 301–315. arXiv : 0904.2110 . дои : 10.1007/s11192-010-0208-6 . ISSN 1588-2861 . S2CID 7614954 .
- ^ Jump up to: Перейти обратно: а б Лу, Ванчжун; Янссен, Дж.; Милиос, Э.; Япкович, Н. ; Чжан, Юнчжэн (1 января 2007 г.). «Сходство узлов в графе цитирования» . Знания и информационные системы . 11 (1): 105–129. дои : 10.1007/s10115-006-0023-9 . ISSN 0219-3116 . S2CID 26234247 .
- ^ Болелли, Левент; Эртекин, Сейда; Джайлз, К. Ли (2006). «Кластеризация научной литературы с использованием анализа графов разреженного цитирования». В Фюрнкранце, Йоханнес; Шеффер, Тобиас; Спилиопулу, Майра (ред.). Обнаружение знаний в базах данных: PKDD 2006 . Конспекты лекций по информатике. Том. 4213. Берлин, Гейдельберг: Springer. стр. 30–41. дои : 10.1007/11871637_8 . ISBN 978-3-540-46048-0 . S2CID 15527080 .
- ^ Хаммон, Норман П.; Дерейан, Патрик (1 марта 1989 г.). «Связность в сети цитирования: развитие теории ДНК» . Социальные сети . 11 (1): 39–63. дои : 10.1016/0378-8733(89)90017-8 . ISSN 0378-8733 .
- ^ Лю, Ханвен; Коу, Хуайчжэнь; Ян, Чао; Ци, Ляньюн (24 апреля 2020 г.). «Рекомендации по статьям, основанным на ключевых словах и популярности, на основе графика ненаправленного цитирования статей» . Сложность . 2020 : e2085638. дои : 10.1155/2020/2085638 . ISSN 1076-2787 .
- ^ Садегян, Али; Сундарам, Лакшман; Ван, Дейзи Чжэ; Гамильтон, Уильям Ф.; Брантинг, Карл; Пфайфер, Крейг (июнь 2018 г.). «Автоматическая маркировка семантических ребер на графиках юридического цитирования» . Искусственный интеллект и право . 26 (2): 127–144. дои : 10.1007/s10506-018-9217-1 . ISSN 0924-8463 . S2CID 254266762 .
- ^ Лаушер, Энн; Эккерт, Кай; Галке, Лукас; Шерп, Ансгар; Ризви, Сайед Тахсин Раза; Ахмед, Шераз; Денгель, Андреас; Цумштейн, Филипп; Кляйн, Аннет (23 мая 2018 г.). «Связанная база данных открытого цитирования» . Материалы 18-й конференции ACM/IEEE по совместной конференции по цифровым библиотекам (PDF) . JCDL '18. Нью-Йорк, штат Нью-Йорк, США: Ассоциация вычислительной техники. стр. 109–118. дои : 10.1145/3197026.3197050 . ISBN 978-1-4503-5178-2 . S2CID 4902279 .
Дальнейшее чтение [ править ]
- Ань, Юань; Янссен, Жаннетт ; Милиос, Евангелос Э. (2004), «Описание и анализ графика цитирования литературы по информатике», Knowledge and Information Systems , 6 (6): 664–678, doi : 10.1007/s10115-003-0128-3 , S2CID 348227 .
- Ён, Фанг; Руссо, Рональд (2001), «Решетки в сетях цитирования: исследование структуры графов цитирования», Scientometrics , 50 (2): 273–287, doi : 10.1023/A:1010573723540 , S2CID 413673 .
- Лу, Ванчжун; Янссен, Дж.; Милиос, Э.; Япкович, Н.; Чжан, Юнчжэн (2007), «Сходство узлов в графе цитирования», Knowledge and Information Systems , 11 (1): 105–129, doi : 10.1007/s10115-006-0023-9 , S2CID 26234247 .