Патентная визуализация
Патентная визуализация — это применение визуализации информации . Число патентов растёт. [1] поощрение компаний рассматривать интеллектуальную собственность как часть своей стратегии. [2] Визуализация патентов, как и картирование патентов , используется для быстрого просмотра портфеля патентов .
Программное обеспечение, предназначенное для визуализации патентов, начало появляться в 2000 году, например Aureka от Aurigin (сейчас принадлежит Thomson Reuters ). [3] Многие платформы для анализа патентов и портфелей, такие как Questel, [4] PatSnap, Patentcloud, Relecura и Patent iNSIGHT Pro, [5] предлагать варианты визуализации конкретных данных в патентных документах путем создания тематических карт , [6] карты приоритетов, отчеты об IP-ландшафте, [7] и т. д. Программное обеспечение преобразует патенты в инфографику или карты, чтобы позволить аналитику «получить представление о данных» и сделать выводы. [8] Также называется патиинформатикой, [9] это «наука анализировать патентную информацию для выявления взаимосвязей и тенденций, которые было бы трудно увидеть при работе с патентными документами по принципу «один-к-одному». [ нужна ссылка ]
Патенты содержат структурированные данные (например, номера публикаций) и неструктурированный текст (например, название, аннотация, формула изобретения и визуальная информация). Структурированные данные обрабатываются с помощью интеллектуального анализа данных , а неструктурированные данные обрабатываются с помощью интеллектуального анализа текста . [10]
Интеллектуальный анализ данных
[ редактировать ]Основным этапом обработки структурированной информации является интеллектуальный анализ данных . [11] возникший в конце 1980-х гг. Интеллектуальный анализ данных включает в себя статистику, искусственный интеллект и машинное обучение . [12] Интеллектуальный анализ патентных данных извлекает информацию из структурированных данных патентного документа. [13] Эти структурированные данные представляют собой библиографические поля, такие как местоположение, дата или статус.
Структурированные поля
[ редактировать ]Структурированные данные | Описание | Использование бизнес-аналитики |
---|---|---|
Данные | Патенты содержат идентифицирующие данные, включая приоритет, данные публикации и дату выдачи.
| Пересекающиеся поля дат и местоположений предлагают глобальное видение технологии во времени и пространстве. |
Правопреемник | Патентоправителями являются организации или физические лица – владельцы патента. | Это поле может предложить рейтинг основных действующих лиц окружающей среды, что позволяет нам визуализировать потенциальных конкурентов или партнеров. |
изобретатель | Изобретатели разрабатывают изобретение/патент. | Поле изобретателей в сочетании с полем правопреемника может создать социальную сеть и предоставить возможность следить за экспертами в этой области. |
Классификация | Классификация может перегруппировать изобретения со схожими технологиями. Наиболее часто используемой является Международная патентная классификация (МПК). Однако патентные организации имеют свою классификацию; например, Европейское патентное ведомство разработало ECLA . | Группировка патентов по темам дает обзор корпуса и потенциальных применений изучаемой технологии. |
Статус | Юридический статус указывает, подана ли заявка, одобрена или отклонена. | Поиск семейства патентов и их правового статуса важен для судебных разбирательств и конкурентной разведки. |
Преимущества
[ редактировать ]Интеллектуальный анализ данных позволяет изучить структуру подачи заявок конкурентами и определить местонахождение основных заявителей на патенты в конкретной области технологий. Этот подход может быть полезен для мониторинга среды, действий и инновационных тенденций конкурентов, а также дает макропредставление о состоянии технологий. [ нужна ссылка ]
Текстовый майнинг
[ редактировать ]Принцип
[ редактировать ]Анализ текста используется для поиска в неструктурированных текстовых документах. [14] [15] Этот метод широко используется в Интернете, он имел успех в биоинформатике , а теперь и в сфере интеллектуальной собственности. [16]
Анализ текста основан на статистическом анализе повторения слов в корпусе. [17] Алгоритм извлекает слова и выражения из заголовка, резюме и претензий и собирает их по склонению . «И» и «если» помечены как слова, не несущие информации, и сохраняются в списке стоп-слов . Стоп-листы могут быть специализированы для проведения точного анализа. Далее алгоритм ранжирует слова по весу в зависимости от их частоты в корпусе патента и частоты документов, содержащих это слово. Оценка за каждое слово рассчитывается по следующей формуле: [18] [19]
Часто используемое слово в нескольких документах имеет меньший вес, чем слово, часто используемое в нескольких патентах. Слова меньше минимального веса удаляются, оставляя список подходящих слов или дескрипторов. Каждый патент связан с дескрипторами, найденными в выбранном документе. Кроме того, в процессе кластеризации эти дескрипторы используются как подмножества, в которых перегруппируются патенты, или как теги для размещения патентов в заранее определенных категориях, например, ключевых словах из Международной патентной классификации.
С помощью анализа текста можно обработать четыре части текста:
- Заголовок
- Абстрактный
- Требовать
- Полнотекстовый патент
Программное обеспечение предлагает различные комбинации, но заголовок, аннотация и утверждение, как правило, используются чаще всего, обеспечивая хороший баланс между помехами и релевантностью.
Преимущества
[ редактировать ]Анализ текста можно использовать для сужения поиска или быстрой оценки корпуса патентов. Например, если запрос выдает нерелевантные документы, многоуровневая иерархия кластеризации идентифицирует их, чтобы удалить и уточнить поиск. Анализ текста также можно использовать для создания внутренних таксономий, специфичных для корпуса, для возможного картирования. [ нужна ссылка ]
Визуализации
[ редактировать ]Объединение патентного анализа и информационных инструментов позволяет получить обзор окружающей среды посредством визуализации с добавленной стоимостью. Поскольку патенты содержат структурированную и неструктурированную информацию, визуализации делятся на две категории. Структурированные данные можно визуализировать с помощью интеллектуального анализа данных на макротематических картах и статистического анализа. Неструктурированная информация может отображаться в виде облаков, карт кластеров и 2D-карт ключевых слов.
Визуализация интеллектуального анализа данных
[ редактировать ]Визуализация | Картина | Описание | Использование бизнес-аналитики |
---|---|---|---|
Матричная диаграмма | Картина | Графический органайзер, используемый для суммирования многомерного набора данных в сетке. | Сравнение данных |
Карта расположения | Картина | Карта с наложенными значениями данных по географическим регионам |
|
Гистограмма | Картина | График с прямоугольными столбцами, пропорциональными значениям, которые они представляют, полезен для численного сравнения. | Эволюция данных |
Линейный график | Картина | График используется для обобщения того, как связаны два параметра и как они изменяются. | Эволюция данных и взаимосвязи |
Круговая диаграмма | Картина | Круговая диаграмма разделена на секции для иллюстрации пропорций. | Сравнение данных |
Пузырьковая диаграмма | Картина | 3-осевая 2D-диаграмма, обеспечивающая визуализацию, аналогичную диаграмме магического квадранта . |
|
Визуализация интеллектуального анализа текста
[ редактировать ]Визуализация | Описание | Использование бизнес-аналитики |
---|---|---|
Список деревьев | Список иерархии |
|
Облако тегов | Полный текст концепций. Размер каждого слова определяется его частотой в корпусе. |
|
2D-карта ключевых слов [20] | Томографическая карта с количественным изображением рельефа, обычно с использованием горизонталей и цветов. Расстояние на карте пропорционально разнице между темами. [13] |
|
Двумерная иерархическая карта кластеров с количественным и качественным представлением связи набора документов с темой, обычно с использованием квантованных ячеек и цветов. Размер ячеек тем может отражать количество патентов на тему относительно общего набора документов. Плотность и распределение внутри тематической ячейки могут быть пропорциональны количеству документов относительно связи с темой и силы связи соответственно. |
| |
Текст разлагается на логические группы и подгруппы, а затем представляется в виде навигационной иерархии этих групп с помощью пропорциональных дуг окружностей. |
|
Визуализация как для интеллектуального анализа данных, так и для интеллектуального анализа текста
[ редактировать ]Картографические визуализации можно использовать как для анализа текста, так и для результатов анализа данных.
Визуализация | Картина | Описание | Использование бизнес-аналитики |
---|---|---|---|
Карта дерева | Картина | Визуализация иерархических структур. Каждый элемент данных или строка в наборе данных представлена прямоугольником, площадь которого пропорциональна выбранным параметрам. |
|
Карта сети | Картина | На сетевой диаграмме объекты связаны друг с другом в форме диаграммы узлов и связей. |
|
Карта цитирования | Картина | На карте цитирования дата цитирования отображается на оси X, а каждая отдельная цитата занимает запись на оси Y. Сильная вертикальная линия указывает дату подачи заявки, показывая, какие ссылки цитируются в патенте, а не те, которые цитируют патент. |
|
Использование
[ редактировать ]Что может подчеркнуть патентная визуализация : [21] [22]
Полевое применение : [24] [22]
- Управление стратегией исследований и разработок
- Конкурентная разведка
- Лицензирование
- Стратегия
Ссылки
[ редактировать ]- ^ [1] [ мертвая ссылка ]
- ^ Кевин Г. Риветт, Дэвид Клайн, «Открытие новой ценности интеллектуальной собственности», Harvard Business Review (январь – февраль 2000 г.)
- ^ «Томсон Рейтер | Аурека | Интеллектуальная собственность» . Архивировано из оригинала 4 февраля 2013 года.
- ^ «Инструменты патентного анализа, картирования и визуализации — PIUG Space — глобальный сайт» .
- ^ «Патент iNSIGHT Pro» . Архивировано из оригинала 21 февраля 2014 г. Проверено 7 февраля 2014 г.
- ^ Проведите анализ патентного портфеля с использованием сравнительных карт тем.
- ^ Отчет о технологиях графена
- ^ Дэниел А. Кейм и IEEE Computer Society, «Визуализация информации и визуальный анализ данных», IEEE TRANSACTIONS ON VISUALIZATION AND COMPUTER GRAPHICS 8 (2002): 1–8.
- ^ Энтони Дж. Трипп, «Патининформатика: задачи для инструментов», World Patent Information 25, n°. 3 (сентябрь 2003 г.): 211–221.
- ^ Лаура Руотсалайнен, «Инструменты интеллектуального анализа данных для технологий и конкурентной разведки» VTT Research Notes 2451 (октябрь 2008 г.)
- ^ [2] Архивировано 12 июня 2010 г., в Wayback Machine.
- ^ «Как развивается интеллектуальный анализ данных» .
- ^ Jump up to: а б Сунгджу Ли, Бёнгун Юн и Ёнтэ Пак, «Подход к открытию новых технологических возможностей: подход к карте патентов на основе ключевых слов», Technovation 29, n°. 6 (июнь): 481–497.
- ^ [3] Архивировано 17 октября 2010 г., в Wayback Machine.
- ^ Бонино, Дарио; Чарамелла, Альберто; Корно, Фульвио (2010). «Обзор современного состояния патентной информации и предстоящих изменений в интеллектуальной патентной информатике». Мировая патентная информация . 32 : 30–38. дои : 10.1016/j.wpi.2009.05.008 .
- ^ Шолом Вайс и др., Анализ текста: прогнозные методы анализа неструктурированной информации, 1-е изд. (Спрингер 2004).
- ^ Антуан Бланшар «Картирование патентов» La Recherche № 398 (2006): 82-83
- ^ Джерард Салтон и Кристофер Бакли, «Подходы к взвешиванию терминов в автоматическом поиске текста», Information Processing & Management 24, n°. 5 (1988): 513-523.
- ^ Ю. Ким, Дж. Су и С. Парк, «Визуализация патентного анализа новых технологий», Expert Systems with Applications 34, вып. 3 (4, 2008): 1804–1812.
- ^ «Карта новостей» . Архивировано из оригинала 8 июля 2010 года . Проверено 28 апреля 2017 г.
- ^ Мияке М., Муне Ю. и Химено К. «Стратегическое управление портфелем интеллектуальной собственности: оценка технологий с использованием «технологической тепловой карты»», Документы Исследовательского института Номура (NRI), n°. 83 (декабрь 2004 г.).
- ^ Jump up to: а б Чарльз Булакиа «Картирование патентов». Архивировано 13 марта 2011 г. в Wayback Machine.
- ^ Ричард Сеймур, «Патентный анализ и картирование металлов платиновой группы», Platinum Metals Review 52, n°. 4 (10, 2008): 231–240.
- ^ Сьюзен Э. Каллен, «Введение. От желудей до дубов: как патентный аудит помогает инновациям полностью раскрыть свой потенциал» IP Value 2010 - Международное руководство для зала заседаний: 26–30