Jump to content

Анализ основного пути

Анализ основного пути — это математический инструмент, впервые предложенный Хаммоном и Дорейаном в 1989 году. [1] для определения основных путей в сети цитирования , которая представляет собой одну из форм ориентированного ациклического графа (DAG). С тех пор он стал эффективным методом картирования технологических траекторий, изучения потоков научных знаний и проведения обзоров литературы.

Анализ основных путей выявляет наиболее значимые пути или цепочки цитирования в сети цитирования. На рисунке показаны основные глобальные ключевые пути (красным) для образца сети цитирования (на основе количества путей поиска и ключевого маршрута 1).

Метод начинается с измерения значимости всех ссылок в сети цитирования с помощью концепции «счета обхода», а затем последовательно объединяет наиболее значимые ссылки в «основной путь», который считается наиболее значимым историческим путем в целевой цитируемости. сеть . Метод применим к любой человеческой деятельности, которую можно организовать в виде сети цитирования . Этот метод обычно применяется для отслеживания путей потока знаний или траекторий развития области науки или техники с помощью библиографических ссылок или ссылок на патенты. [2] [3] [4] Его также применяли к судебным решениям, чтобы проследить развивающиеся изменения юридических заключений. [5] Анализ основных путей в последнее время привлек внимание ученых. Академические исследования, связанные с анализом основных путей, быстро росли с 2007 года. Список академических статей, которые знакомят, объясняют, применяют, изменяют или расширяют этот метод, был создан Хаммоном и Дорейаном. [1] можно найти здесь . Тем не менее, существуют проблемы, которые широко не обсуждаются при применении этого метода, включая обработку данных цитирования, выбор правильной схемы весов обхода, параметры поиска и интерпретацию полученных путей. [6]

Анализ основного пути впервые предложен в работе Хаммона и Дориана (1989). [1] в котором они предлагают другой подход к анализу сети цитирования, «где сохраняются соединительные нити в сети и основное внимание уделяется ссылкам в сети, а не узлам». [1] Они называют полученную цепочку наиболее используемых ссылок цитирования «основным путем» и утверждают, что «мы интуитивно полагаем, что основной путь, выбранный на основе наиболее используемого пути, будет определять основной поток литературы». Идея была проверена с помощью набора статей по исследованию ДНК. Чтобы сделать метод более практичным, Лю и Лу (2012) [7] расширяет метод, включив в него поиск по ключевому маршруту. Самая полезная функция поиска ключевых маршрутов заключается в том, что можно просматривать различные уровни основных путей, регулируя номера ключевых маршрутов.

Анализ основного пути выполняется в два этапа. На первом этапе получают количество проходов каждой ссылки в сети цитирования. В литературе упоминается несколько типов подсчета обхода. На втором этапе осуществляется поиск основных путей путем связывания значимых ссылок в соответствии с размером счетчиков обходов. Прежде чем приступить к анализу основного пути, необходимо подготовить сеть цитирования.

Подготовка сети цитирования

[ редактировать ]

Прежде чем приступить к анализу основного пути, необходимо подготовить сеть цитирования . В сети цитирования узлы представляют такие документы, как научные статьи, патенты или судебные дела. Эти узлы связаны с использованием информации о цитировании. Сети цитирования по своей природе являются направленными, поскольку два узла на противоположном конце ссылки не симметричны в своих ролях. Что касается направления, в этой статье принято соглашение, согласно которому цитируемый узел указывает на цитирующий узел, что означает тот факт, что знания из цитируемого узла передаются к цитирующему узлу. Сеть цитирования также по своей природе ациклична, что означает, что узел никогда не сможет вернуться в цепочку сам по себе, если кто-то движется по ссылкам, следуя их направлению.

Прежде чем двигаться дальше, здесь будут определены несколько терминов, связанных с сетью цитирования. Головы — это узлы, к которым ведет стрелка направления. Хвосты — это узлы на других концах стрелки направления. Источники — это узлы, которые цитируются, но не ссылаются ни на какие другие. Приемники ссылаются на другие узлы, но не цитируются. Предки — это узлы, до которых можно проследить от целевого узла. Потомки — это узлы, до которых можно добраться от цели, если двигаться по ссылкам, следуя их направлению.

Рисунок 1. Значения SPC для выборочной сети цитирования

Обход засчитывается

[ редактировать ]

Подсчеты проходов измеряют значимость ссылки. В литературе обсуждается несколько типов подсчета обходов, включая счетчик путей поиска (SPC), счетчик каналов пути поиска (SPLC), пару узлов пути поиска (SPNP) и другие варианты. [8] Все эти счетчики прохождения будут отмечены как SPX.

Рисунок 2. Значения SPLC для выборочной сети цитирования

Количество путей поиска (SPC)

[ редактировать ]

SPC ссылки — это количество раз, когда ссылка проходится по всем возможным путям от всех источников ко всем приемникам. SPC впервые предложен Владимиром Батагелем . [9] Значения SPC для каждой ссылки в образце сети цитирования показаны на рисунке 1. Значение SPC для ссылки (B, D) равно 5, поскольку через нее проходят пять путей (BDFHK, BDFIL, BDFIMN, BDIL и BDIMN).

Рисунок 3. Значения SPNP для выборочной сети цитирования
[ редактировать ]

SPLC ссылки — это количество раз, когда ссылка проходится по всем возможным путям от всех предков хвостового узла (включая его самого) ко всем приемникам. SPLC впервые предложен Хаммоном и Дорейаном. [1] На рисунке 2 представлены значения SPLC для каждой ссылки в той же сети цитирования, что и на рисунке 1. Шесть путей, проходящих через ссылку (D, F), таким образом, дают ей значение SPLC 6. Это: BDFHK, BDFIL, BDFIMN, DFHK, DFIL и DFIMN, отметив, что все пути начинаются либо с предка D, которым является B, либо с самого D.

Пара узлов пути поиска (SPNP)

[ редактировать ]

SPNP ссылки — это количество раз, когда ссылка проходится по всем возможным путям от всех предков хвостового узла (включая его самого) ко всем потомкам головного узла (включая его самого). SPNP впервые предложен Хаммоном и Дорейаном. [1] Значения SPNP ссылки (C, H) равны 6, поскольку существует 6 путей, которые начинаются с A, B, C (A и B — предки C) и заканчиваются H и K (K — потомок H). Этими путями являются ACH, ACHK, BCH, BCHK, CH и CHK.

Рисунок 4. Локальные основные пути в примере сети цитирования
[ редактировать ]

На основании подсчета обходов можно затем найти наиболее значимый путь(и). Существует несколько способов их поиска, включая локальный, глобальный поиск и поиск по ключевому маршруту.

Рисунок 5. Глобальные основные пути в примере сети цитирования
[ редактировать ]

Локальный поиск упоминается в Хаммоне и Дориане. [1] как поиск с приоритетом. Этот процесс поиска всегда выбирает следующую ссылку(и) с самым высоким SPX в качестве исходящей ссылки. Он продолжает отслеживать наиболее посещаемые ссылки, таким образом получая основной поток среди всех цепочек цитирования. На рисунке 4 показаны локальные основные пути, полученные на основе SPC. Заметим, что когда поиск достигает узла I, два исходящих канала имеют одинаковые значения SPC, что впоследствии создает два пути.

Рисунок 6. Основные пути локальных ключевых маршрутов в примере сети цитирования
[ редактировать ]

Глобальный поиск просто предлагает цепочку цитирования с самым большим общим SPX. Концепция глобального поиска аналогична методу критического пути в планировании проектов. Глобальные основные пути выборочной сети цитирования на основе SPC представлены на рисунке 5. Сумма всех значений SPC в пути BDFIMN равна 15, что является самым большим среди всех возможных путей.

Рисунок 7. Основные пути глобальных ключевых маршрутов в примере сети цитирования
[ редактировать ]

Поиск по ключевому маршруту предназначен для того, чтобы избежать проблемы отсутствия важных ссылок как при локальном, так и при глобальном поиске. Проблема в показанных выше локальных и глобальных основных путях, в которых одно из наиболее важных звеньев (H, K) не включено в основные пути. Как описано Лю и Лу (2012), [7] подход ищет основные пути от указанных ссылок (ключевых маршрутов), что гарантирует включение ссылок. Можно также указать несколько ссылок для получения нескольких основных путей. Дополнительным преимуществом подхода с ключевыми маршрутами является то, что можно контролировать детали основных путей, изменяя количество ключевых маршрутов. Чем больше указано количество ключей-маршрутов, тем больше деталей раскрывается. Когда количество ключевых маршрутов увеличивается до определенной точки, поиск возвращает всю сеть цитирования. На рисунках 6 и 7 показаны основные пути локального ключа и глобального ключа в сети цитирования образцов. В обоих основных путях номер ключевого маршрута установлен равным 1, т.е. выполняется поиск по базе только по верхним ссылкам. Поскольку имеется два верхних звена (B, D) и (H, K), результирующие основные пути включают в себя оба из них.

Варианты

[ редактировать ]

Помимо подхода поиска по ключевому маршруту, варианты метода включают агрегатный и стохастический подход, [10] рассматривает упадок распространения знаний, [8] и т. д.

Приложения

[ редактировать ]

Метод был применен к трем типам систем документации, которые сохраняют традицию ссылок на предыдущие документы. Это академическая статья, патент и система судебной документации.

Академическая статья

[ редактировать ]

Базы данных академического цитирования, такие как Web of Science и Scopus, содержат исчерпывающую оцифрованную информацию о цитировании. Эта информация позволяет применять анализ основных путей для изучения структуры знаний или отслеживания потока знаний в любых научных областях. Некоторые ранние приложения исследуют тему центральности-производительности. [11] разрешение конфликтов, [12] и т. д. Более поздние применения включают фуллерены, [4] нанотрубки, [4] анализ оболочки данных, [2] [13] [14] управление цепочками поставок, [15] корпоративная социальная ответственность, [16] ИТ-аутсорсинг, [17] медицинский туризм, [18] и т. д.

Патенты, ссылающиеся на известный уровень техники, являются обычной практикой. Например, каждый патентный документ США включает раздел «Цитированные ссылки», в котором перечислены известные уровни техники патента. Патентные базы данных, такие как Clarivate Analytics и Webpat, предоставляют оцифрованную информацию о цитировании патентов. Верспаген (2007) [3] и Мина (2007) [19] — это две ранние работы, в которых к патентным данным применяется анализ основных путей.

Судебный документ

[ редактировать ]

В системе общего права документ решения суда обычно ссылается на ранее опубликованные мнения с целью обоснования текущего решения. Эти судебные ссылки или юридические цитаты также можно использовать для создания сетей цитирования и последующего отслеживания изменений юридических заключений. Возможности исследований в этой области широко открыты. Лю и др. (2014) [5] провели предварительное исследование по такому типу приложений.

Внедрение программного обеспечения

[ редактировать ]

Анализ основного пути реализован в Pajek , широко используемом программном обеспечении для анализа социальных сетей, написанном Владимиром Батагелем и Андреем Мрваром из Университета Любляны , Словения. Чтобы провести анализ основного пути в Pajek, необходимо сначала подготовить сеть цитирования и заставить Pajek читать в сети. Далее в главном меню Pajek вычисляет количество проходов всех ссылок в сети, применяя одну из следующих последовательностей команд (в зависимости от выбора количества проходов).

Сеть → Ациклическая сеть → Создать взвешенную сеть + Вектор → Веса обхода → Число каналов поиска пути (SPC) или

Сеть → Ациклическая сеть → Создать взвешенную сеть + Вектор → Веса обхода → Число каналов поиска пути (SPLC) или

Сеть → Ациклическая сеть → Создать взвешенную сеть + Вектор → Веса обхода → Пары узлов пути поиска (SPNP)

После вычисления количества обходов следующие последовательности команд находят основные пути.

Для местных основных путей

Сеть → Ациклическая сеть → Создать (под)сеть → Основные пути → Локальный поиск → Вперед

Для глобальных основных путей

Сеть → Ациклическая сеть → Создать (под)сеть → Основные пути → Глобальный поиск → Стандартный.

Для основных путей локального ключевого маршрута

Сеть → Ациклическая сеть → Создать (под)сеть → Основные пути → Локальный поиск → Ключевой маршрут

Для основных путей глобальных ключевых маршрутов

Сеть → Ациклическая сеть → Создать (под)сеть → Основные пути → Глобальный поиск → Ключевой маршрут

Помимо поиска по ключевому маршруту, начиная с версии Pajek 5.03 (4 января 2018 г.), добавлена ​​более гибкая функция поиска. Новая функция позволяет осуществлять локальный и глобальный поиск по вершинам, определенным кластером. Последовательность команд следующая:

Сеть → Ациклическая сеть → Создать (под)сеть → Основные пути → Локальный поиск → Ключевой маршрут → Через вершины в кластере

Сеть → Ациклическая сеть → Создать (под)сеть → Основные пути → Глобальный поиск → Ключевой маршрут → Через вершины в кластере

  1. ^ Jump up to: а б с д и ж г Хаммон, Норман П.; Дориан, Патрик (1989). «Связность в сети цитирования: развитие теории ДНК». Социальные сети . 11 (1): 39–63. дои : 10.1016/0378-8733(89)90017-8 .
  2. ^ Jump up to: а б Лю, Джон С.; Лу, Луи YY; Лу, Вэнь-Мин; Лин, Брюс JY (2013). «Анализ охвата данных 1978–2010: обзор литературы на основе цитирования». Омега . 41 (1): 3–15. дои : 10.1016/j.omega.2010.12.006 .
  3. ^ Jump up to: а б Верспаген, Барт (1 марта 2007 г.). «Отображение технологических траекторий как сетей патентного цитирования: исследование истории исследований топливных элементов» . Достижения в области сложных систем . 10 (1): 93–115. дои : 10.1142/S0219525907000945 . ISSN   0219-5259 .
  4. ^ Jump up to: а б с Люсио-Ариас, Диана; Лейдесдорф, Лоэт (01 октября 2008 г.). «Анализ основного пути и переходы, зависящие от пути, в историограммах на основе HistCite™». Журнал Американского общества информатики и технологий . 59 (12): 1948–1962. дои : 10.1002/asi.20903 . ISSN   1532-2890 .
  5. ^ Jump up to: а б Лю, Джон С.; Чен, Сяо-Хуэй; Хо, Мэй Сю-Цзин; Ли, Ю-Чен (01 декабря 2014 г.). «Цитаты разной степени релевантности: прослеживание основных путей юридических заключений». Журнал Ассоциации информационных наук и технологий . 65 (12): 2479–2488. дои : 10.1002/asi.23135 . ISSN   2330-1643 .
  6. ^ Лю, Джон С.; Лу, Луи YY; Хо, Мэй Сю-Цзин (01 апреля 2019 г.). «Несколько замечаний по анализу основных путей» . Наукометрика . 119 (1): 379–391. дои : 10.1007/s11192-019-03034-x . ISSN   1588-2861 .
  7. ^ Jump up to: а б Лю, Джон С.; Лу, Луи YY (01 марта 2012 г.). «Комплексный подход к анализу основных путей: разработка индекса Хирша на примере». Журнал Американского общества информатики и технологий . 63 (3): 528–542. дои : 10.1002/asi.21692 . ISSN   1532-2890 .
  8. ^ Jump up to: а б Лю, Джон С.; Куан, Чунг-Хуэй (01 февраля 2016 г.). «Новый подход к анализу основных путей: упадок распространения знаний». Журнал Ассоциации информационных наук и технологий . 67 (2): 465–476. дои : 10.1002/asi.23384 . ISSN   2330-1643 .
  9. ^ Батагель, В. (2003). Эффективные алгоритмы анализа сети цитирования. Препринт arXiv cs/0309023 .
  10. ^ Йе, Вундон; Ким, Сонхо; Ли, Джэ Мин; Кан, Джэу (01 января 2014 г.). «Агрегативная и стохастическая модель идентификации основного пути: пример графена». Наукометрика . 98 (1): 633–655. дои : 10.1007/s11192-013-1140-3 . ISSN   0138-9130 .
  11. ^ Хаммон, Норман П.; Дориан, Патрик; Фриман, Линтон К. (18 августа 2016 г.). «Анализ структуры литературы о центральности и производительности, созданной между 1948 и 1979 годами». Знание . 11 (4): 459–480. дои : 10.1177/107554709001100405 .
  12. ^ Карли, Кэтлин М.; Хаммон, Норман П.; Харти, Марта (17 августа 2016 г.). «Научное влияние». Знание . 14 (4): 417–447. дои : 10.1177/107554709301400406 .
  13. ^ Лю, Джон С.; Лу, Луи YY; Лу, Вэнь-Мин (2016). «Направления исследований в области анализа оболочки данных». Омега . 58 : 33–45. дои : 10.1016/j.omega.2015.04.004 .
  14. ^ Лю, Джон С.; Лу, Луи YY; Лу, Вэнь-Мин; Лин, Брюс JY (2013). «Обзор приложений DEA». Омега . 41 (5): 893–902. дои : 10.1016/j.omega.2012.11.004 .
  15. ^ Клаудия Коликкья; Фернанда Строцци (15 июня 2012 г.). «Управление рисками цепочки поставок: новая методология систематического обзора литературы». Управление цепочками поставок . 17 (4): 403–418. дои : 10.1108/13598541211246558 . ISSN   1359-8546 .
  16. ^ Лу, Луи YY; Лю, Джон С. (01 марта 2014 г.). «Пути распространения знаний о корпоративной социальной ответственности - с 1970 по 2011 год». Корпоративная социальная ответственность и экологический менеджмент . 21 (2): 113–128. дои : 10.1002/csr.1309 . ISSN   1535-3966 .
  17. ^ Лян, Хуэйган; Ван, Цзянь-Цзюнь; Сюэ, Яцзюн; Цуй, Сяокун (2016). «Исследование ИТ-аутсорсинга с 1992 по 2013 год: обзор литературы, основанный на анализе основных путей». Информация и управление . 53 (2): 227–251. дои : 10.1016/j.im.2015.10.001 .
  18. ^ Чуанг, Томас С.; Лю, Джон С.; Лу, Луи YY; Ли, Ячи (2014). «Основные направления медицинского туризма: от трансплантации к благоустройству». Управление туризмом . 45 : 49–58. дои : 10.1016/j.tourman.2014.03.016 .
  19. ^ Мина, А.; Рамлоган, Р.; Тампуболон, Г.; Меткалф, Дж. С. (2007). «Отображение эволюционных траекторий: применение к росту и трансформации медицинских знаний». Исследовательская политика . 36 (5): 789–806. дои : 10.1016/j.respol.2006.12.007 .
[ редактировать ]
  • Pajek — бесплатное программное обеспечение для анализа социальных сетей.
  • Список статей основного пути . Эта страница содержит список научных статей, которые знакомят, объясняют, применяют, изменяют или расширяют метод, разработанный Хаммоном и Дорейаном.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: ab7c022a7f579b5020d5241be2906947__1713076740
URL1:https://arc.ask3.ru/arc/aa/ab/47/ab7c022a7f579b5020d5241be2906947.html
Заголовок, (Title) документа по адресу, URL1:
Main path analysis - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)