Анализ основного пути
Анализ основного пути — это математический инструмент, впервые предложенный Хаммоном и Дорейаном в 1989 году. [1] для определения основных путей в сети цитирования , которая представляет собой одну из форм ориентированного ациклического графа (DAG). С тех пор он стал эффективным методом картирования технологических траекторий, изучения потоков научных знаний и проведения обзоров литературы.

Метод начинается с измерения значимости всех ссылок в сети цитирования с помощью концепции «счета обхода», а затем последовательно объединяет наиболее значимые ссылки в «основной путь», который считается наиболее значимым историческим путем в целевой цитируемости. сеть . Метод применим к любой человеческой деятельности, которую можно организовать в виде сети цитирования . Этот метод обычно применяется для отслеживания путей потока знаний или траекторий развития области науки или техники с помощью библиографических ссылок или ссылок на патенты. [2] [3] [4] Его также применяли к судебным решениям, чтобы проследить развивающиеся изменения юридических заключений. [5] Анализ основных путей в последнее время привлек внимание ученых. Академические исследования, связанные с анализом основных путей, быстро росли с 2007 года. Список академических статей, которые знакомят, объясняют, применяют, изменяют или расширяют этот метод, был создан Хаммоном и Дорейаном. [1] можно найти здесь . Тем не менее, существуют проблемы, которые широко не обсуждаются при применении этого метода, включая обработку данных цитирования, выбор правильной схемы весов обхода, параметры поиска и интерпретацию полученных путей. [6]
История
[ редактировать ]Анализ основного пути впервые предложен в работе Хаммона и Дориана (1989). [1] в котором они предлагают другой подход к анализу сети цитирования, «где сохраняются соединительные нити в сети и основное внимание уделяется ссылкам в сети, а не узлам». [1] Они называют полученную цепочку наиболее используемых ссылок цитирования «основным путем» и утверждают, что «мы интуитивно полагаем, что основной путь, выбранный на основе наиболее используемого пути, будет определять основной поток литературы». Идея была проверена с помощью набора статей по исследованию ДНК. Чтобы сделать метод более практичным, Лю и Лу (2012) [7] расширяет метод, включив в него поиск по ключевому маршруту. Самая полезная функция поиска ключевых маршрутов заключается в том, что можно просматривать различные уровни основных путей, регулируя номера ключевых маршрутов.
Метод
[ редактировать ]Анализ основного пути выполняется в два этапа. На первом этапе получают количество проходов каждой ссылки в сети цитирования. В литературе упоминается несколько типов подсчета обхода. На втором этапе осуществляется поиск основных путей путем связывания значимых ссылок в соответствии с размером счетчиков обходов. Прежде чем приступить к анализу основного пути, необходимо подготовить сеть цитирования.
Подготовка сети цитирования
[ редактировать ]Прежде чем приступить к анализу основного пути, необходимо подготовить сеть цитирования . В сети цитирования узлы представляют такие документы, как научные статьи, патенты или судебные дела. Эти узлы связаны с использованием информации о цитировании. Сети цитирования по своей природе являются направленными, поскольку два узла на противоположном конце ссылки не симметричны в своих ролях. Что касается направления, в этой статье принято соглашение, согласно которому цитируемый узел указывает на цитирующий узел, что означает тот факт, что знания из цитируемого узла передаются к цитирующему узлу. Сеть цитирования также по своей природе ациклична, что означает, что узел никогда не сможет вернуться в цепочку сам по себе, если кто-то движется по ссылкам, следуя их направлению.
Прежде чем двигаться дальше, здесь будут определены несколько терминов, связанных с сетью цитирования. Головы — это узлы, к которым ведет стрелка направления. Хвосты — это узлы на других концах стрелки направления. Источники — это узлы, которые цитируются, но не ссылаются ни на какие другие. Приемники ссылаются на другие узлы, но не цитируются. Предки — это узлы, до которых можно проследить от целевого узла. Потомки — это узлы, до которых можно добраться от цели, если двигаться по ссылкам, следуя их направлению.

Обход засчитывается
[ редактировать ]Подсчеты проходов измеряют значимость ссылки. В литературе обсуждается несколько типов подсчета обходов, включая счетчик путей поиска (SPC), счетчик каналов пути поиска (SPLC), пару узлов пути поиска (SPNP) и другие варианты. [8] Все эти счетчики прохождения будут отмечены как SPX.

Количество путей поиска (SPC)
[ редактировать ]SPC ссылки — это количество раз, когда ссылка проходится по всем возможным путям от всех источников ко всем приемникам. SPC впервые предложен Владимиром Батагелем . [9] Значения SPC для каждой ссылки в образце сети цитирования показаны на рисунке 1. Значение SPC для ссылки (B, D) равно 5, поскольку через нее проходят пять путей (BDFHK, BDFIL, BDFIMN, BDIL и BDIMN).

Количество ссылок на пути поиска (SPLC)
[ редактировать ]SPLC ссылки — это количество раз, когда ссылка проходится по всем возможным путям от всех предков хвостового узла (включая его самого) ко всем приемникам. SPLC впервые предложен Хаммоном и Дорейаном. [1] На рисунке 2 представлены значения SPLC для каждой ссылки в той же сети цитирования, что и на рисунке 1. Шесть путей, проходящих через ссылку (D, F), таким образом, дают ей значение SPLC 6. Это: BDFHK, BDFIL, BDFIMN, DFHK, DFIL и DFIMN, отметив, что все пути начинаются либо с предка D, которым является B, либо с самого D.
Пара узлов пути поиска (SPNP)
[ редактировать ]SPNP ссылки — это количество раз, когда ссылка проходится по всем возможным путям от всех предков хвостового узла (включая его самого) ко всем потомкам головного узла (включая его самого). SPNP впервые предложен Хаммоном и Дорейаном. [1] Значения SPNP ссылки (C, H) равны 6, поскольку существует 6 путей, которые начинаются с A, B, C (A и B — предки C) и заканчиваются H и K (K — потомок H). Этими путями являются ACH, ACHK, BCH, BCHK, CH и CHK.

Поиск пути
[ редактировать ]На основании подсчета обходов можно затем найти наиболее значимый путь(и). Существует несколько способов их поиска, включая локальный, глобальный поиск и поиск по ключевому маршруту.

Локальный поиск
[ редактировать ]Локальный поиск упоминается в Хаммоне и Дориане. [1] как поиск с приоритетом. Этот процесс поиска всегда выбирает следующую ссылку(и) с самым высоким SPX в качестве исходящей ссылки. Он продолжает отслеживать наиболее посещаемые ссылки, таким образом получая основной поток среди всех цепочек цитирования. На рисунке 4 показаны локальные основные пути, полученные на основе SPC. Заметим, что когда поиск достигает узла I, два исходящих канала имеют одинаковые значения SPC, что впоследствии создает два пути.

Глобальный поиск
[ редактировать ]Глобальный поиск просто предлагает цепочку цитирования с самым большим общим SPX. Концепция глобального поиска аналогична методу критического пути в планировании проектов. Глобальные основные пути выборочной сети цитирования на основе SPC представлены на рисунке 5. Сумма всех значений SPC в пути BDFIMN равна 15, что является самым большим среди всех возможных путей.

Поиск ключевого маршрута
[ редактировать ]Поиск по ключевому маршруту предназначен для того, чтобы избежать проблемы отсутствия важных ссылок как при локальном, так и при глобальном поиске. Проблема в показанных выше локальных и глобальных основных путях, в которых одно из наиболее важных звеньев (H, K) не включено в основные пути. Как описано Лю и Лу (2012), [7] подход ищет основные пути от указанных ссылок (ключевых маршрутов), что гарантирует включение ссылок. Можно также указать несколько ссылок для получения нескольких основных путей. Дополнительным преимуществом подхода с ключевыми маршрутами является то, что можно контролировать детали основных путей, изменяя количество ключевых маршрутов. Чем больше указано количество ключей-маршрутов, тем больше деталей раскрывается. Когда количество ключевых маршрутов увеличивается до определенной точки, поиск возвращает всю сеть цитирования. На рисунках 6 и 7 показаны основные пути локального ключа и глобального ключа в сети цитирования образцов. В обоих основных путях номер ключевого маршрута установлен равным 1, т.е. выполняется поиск по базе только по верхним ссылкам. Поскольку имеется два верхних звена (B, D) и (H, K), результирующие основные пути включают в себя оба из них.
Варианты
[ редактировать ]Помимо подхода поиска по ключевому маршруту, варианты метода включают агрегатный и стохастический подход, [10] рассматривает упадок распространения знаний, [8] и т. д.
Приложения
[ редактировать ]Метод был применен к трем типам систем документации, которые сохраняют традицию ссылок на предыдущие документы. Это академическая статья, патент и система судебной документации.
Академическая статья
[ редактировать ]Базы данных академического цитирования, такие как Web of Science и Scopus, содержат исчерпывающую оцифрованную информацию о цитировании. Эта информация позволяет применять анализ основных путей для изучения структуры знаний или отслеживания потока знаний в любых научных областях. Некоторые ранние приложения исследуют тему центральности-производительности. [11] разрешение конфликтов, [12] и т. д. Более поздние применения включают фуллерены, [4] нанотрубки, [4] анализ оболочки данных, [2] [13] [14] управление цепочками поставок, [15] корпоративная социальная ответственность, [16] ИТ-аутсорсинг, [17] медицинский туризм, [18] и т. д.
Патент
[ редактировать ]Патенты, ссылающиеся на известный уровень техники, являются обычной практикой. Например, каждый патентный документ США включает раздел «Цитированные ссылки», в котором перечислены известные уровни техники патента. Патентные базы данных, такие как Clarivate Analytics и Webpat, предоставляют оцифрованную информацию о цитировании патентов. Верспаген (2007) [3] и Мина (2007) [19] — это две ранние работы, в которых к патентным данным применяется анализ основных путей.
Судебный документ
[ редактировать ]В системе общего права документ решения суда обычно ссылается на ранее опубликованные мнения с целью обоснования текущего решения. Эти судебные ссылки или юридические цитаты также можно использовать для создания сетей цитирования и последующего отслеживания изменений юридических заключений. Возможности исследований в этой области широко открыты. Лю и др. (2014) [5] провели предварительное исследование по такому типу приложений.
Внедрение программного обеспечения
[ редактировать ]Анализ основного пути реализован в Pajek , широко используемом программном обеспечении для анализа социальных сетей, написанном Владимиром Батагелем и Андреем Мрваром из Университета Любляны , Словения. Чтобы провести анализ основного пути в Pajek, необходимо сначала подготовить сеть цитирования и заставить Pajek читать в сети. Далее в главном меню Pajek вычисляет количество проходов всех ссылок в сети, применяя одну из следующих последовательностей команд (в зависимости от выбора количества проходов).
Сеть → Ациклическая сеть → Создать взвешенную сеть + Вектор → Веса обхода → Число каналов поиска пути (SPC) или
Сеть → Ациклическая сеть → Создать взвешенную сеть + Вектор → Веса обхода → Число каналов поиска пути (SPLC) или
Сеть → Ациклическая сеть → Создать взвешенную сеть + Вектор → Веса обхода → Пары узлов пути поиска (SPNP)
После вычисления количества обходов следующие последовательности команд находят основные пути.
Для местных основных путей
Сеть → Ациклическая сеть → Создать (под)сеть → Основные пути → Локальный поиск → Вперед
Для глобальных основных путей
Сеть → Ациклическая сеть → Создать (под)сеть → Основные пути → Глобальный поиск → Стандартный.
Для основных путей локального ключевого маршрута
Сеть → Ациклическая сеть → Создать (под)сеть → Основные пути → Локальный поиск → Ключевой маршрут
Для основных путей глобальных ключевых маршрутов
Сеть → Ациклическая сеть → Создать (под)сеть → Основные пути → Глобальный поиск → Ключевой маршрут
Помимо поиска по ключевому маршруту, начиная с версии Pajek 5.03 (4 января 2018 г.), добавлена более гибкая функция поиска. Новая функция позволяет осуществлять локальный и глобальный поиск по вершинам, определенным кластером. Последовательность команд следующая:
Сеть → Ациклическая сеть → Создать (под)сеть → Основные пути → Локальный поиск → Ключевой маршрут → Через вершины в кластере
Сеть → Ациклическая сеть → Создать (под)сеть → Основные пути → Глобальный поиск → Ключевой маршрут → Через вершины в кластере
Ссылки
[ редактировать ]- ^ Jump up to: а б с д и ж г Хаммон, Норман П.; Дориан, Патрик (1989). «Связность в сети цитирования: развитие теории ДНК». Социальные сети . 11 (1): 39–63. дои : 10.1016/0378-8733(89)90017-8 .
- ^ Jump up to: а б Лю, Джон С.; Лу, Луи YY; Лу, Вэнь-Мин; Лин, Брюс JY (2013). «Анализ охвата данных 1978–2010: обзор литературы на основе цитирования». Омега . 41 (1): 3–15. дои : 10.1016/j.omega.2010.12.006 .
- ^ Jump up to: а б Верспаген, Барт (1 марта 2007 г.). «Отображение технологических траекторий как сетей патентного цитирования: исследование истории исследований топливных элементов» . Достижения в области сложных систем . 10 (1): 93–115. дои : 10.1142/S0219525907000945 . ISSN 0219-5259 .
- ^ Jump up to: а б с Люсио-Ариас, Диана; Лейдесдорф, Лоэт (01 октября 2008 г.). «Анализ основного пути и переходы, зависящие от пути, в историограммах на основе HistCite™». Журнал Американского общества информатики и технологий . 59 (12): 1948–1962. дои : 10.1002/asi.20903 . ISSN 1532-2890 .
- ^ Jump up to: а б Лю, Джон С.; Чен, Сяо-Хуэй; Хо, Мэй Сю-Цзин; Ли, Ю-Чен (01 декабря 2014 г.). «Цитаты разной степени релевантности: прослеживание основных путей юридических заключений». Журнал Ассоциации информационных наук и технологий . 65 (12): 2479–2488. дои : 10.1002/asi.23135 . ISSN 2330-1643 .
- ^ Лю, Джон С.; Лу, Луи YY; Хо, Мэй Сю-Цзин (01 апреля 2019 г.). «Несколько замечаний по анализу основных путей» . Наукометрика . 119 (1): 379–391. дои : 10.1007/s11192-019-03034-x . ISSN 1588-2861 .
- ^ Jump up to: а б Лю, Джон С.; Лу, Луи YY (01 марта 2012 г.). «Комплексный подход к анализу основных путей: разработка индекса Хирша на примере». Журнал Американского общества информатики и технологий . 63 (3): 528–542. дои : 10.1002/asi.21692 . ISSN 1532-2890 .
- ^ Jump up to: а б Лю, Джон С.; Куан, Чунг-Хуэй (01 февраля 2016 г.). «Новый подход к анализу основных путей: упадок распространения знаний». Журнал Ассоциации информационных наук и технологий . 67 (2): 465–476. дои : 10.1002/asi.23384 . ISSN 2330-1643 .
- ^ Батагель, В. (2003). Эффективные алгоритмы анализа сети цитирования. Препринт arXiv cs/0309023 .
- ^ Йе, Вундон; Ким, Сонхо; Ли, Джэ Мин; Кан, Джэу (01 января 2014 г.). «Агрегативная и стохастическая модель идентификации основного пути: пример графена». Наукометрика . 98 (1): 633–655. дои : 10.1007/s11192-013-1140-3 . ISSN 0138-9130 .
- ^ Хаммон, Норман П.; Дориан, Патрик; Фриман, Линтон К. (18 августа 2016 г.). «Анализ структуры литературы о центральности и производительности, созданной между 1948 и 1979 годами». Знание . 11 (4): 459–480. дои : 10.1177/107554709001100405 .
- ^ Карли, Кэтлин М.; Хаммон, Норман П.; Харти, Марта (17 августа 2016 г.). «Научное влияние». Знание . 14 (4): 417–447. дои : 10.1177/107554709301400406 .
- ^ Лю, Джон С.; Лу, Луи YY; Лу, Вэнь-Мин (2016). «Направления исследований в области анализа оболочки данных». Омега . 58 : 33–45. дои : 10.1016/j.omega.2015.04.004 .
- ^ Лю, Джон С.; Лу, Луи YY; Лу, Вэнь-Мин; Лин, Брюс JY (2013). «Обзор приложений DEA». Омега . 41 (5): 893–902. дои : 10.1016/j.omega.2012.11.004 .
- ^ Клаудия Коликкья; Фернанда Строцци (15 июня 2012 г.). «Управление рисками цепочки поставок: новая методология систематического обзора литературы». Управление цепочками поставок . 17 (4): 403–418. дои : 10.1108/13598541211246558 . ISSN 1359-8546 .
- ^ Лу, Луи YY; Лю, Джон С. (01 марта 2014 г.). «Пути распространения знаний о корпоративной социальной ответственности - с 1970 по 2011 год». Корпоративная социальная ответственность и экологический менеджмент . 21 (2): 113–128. дои : 10.1002/csr.1309 . ISSN 1535-3966 .
- ^ Лян, Хуэйган; Ван, Цзянь-Цзюнь; Сюэ, Яцзюн; Цуй, Сяокун (2016). «Исследование ИТ-аутсорсинга с 1992 по 2013 год: обзор литературы, основанный на анализе основных путей». Информация и управление . 53 (2): 227–251. дои : 10.1016/j.im.2015.10.001 .
- ^ Чуанг, Томас С.; Лю, Джон С.; Лу, Луи YY; Ли, Ячи (2014). «Основные направления медицинского туризма: от трансплантации к благоустройству». Управление туризмом . 45 : 49–58. дои : 10.1016/j.tourman.2014.03.016 .
- ^ Мина, А.; Рамлоган, Р.; Тампуболон, Г.; Меткалф, Дж. С. (2007). «Отображение эволюционных траекторий: применение к росту и трансформации медицинских знаний». Исследовательская политика . 36 (5): 789–806. дои : 10.1016/j.respol.2006.12.007 .
Внешние ссылки
[ редактировать ]- Pajek — бесплатное программное обеспечение для анализа социальных сетей.
- Список статей основного пути . Эта страница содержит список научных статей, которые знакомят, объясняют, применяют, изменяют или расширяют метод, разработанный Хаммоном и Дорейаном.