AMiner (база данных)
Тип сайта | Библиографическая база данных |
---|---|
Владелец | Университет Цинхуа |
URL-адрес | www |
Регистрация | Необязательный |
Запущен | март 2006 г |
Текущий статус | Активный |
AMiner (ранее ArnetMiner ) — бесплатный онлайн-сервис, используемый для индексации, поиска и анализа больших научных данных .
Обзор
[ редактировать ]AMiner (ArnetMiner) предназначен для поиска и выполнения по интеллектуальному анализу данных операций научных публикаций в Интернете , используя анализ социальных сетей для выявления связей между исследователями, конференциями и публикациями. [1] Это позволяет ему предоставлять такие услуги, как поиск экспертов, географический поиск, анализ тенденций, рекомендации рецензентов, поиск ассоциаций, поиск курсов, оценка академической успеваемости и тематическое моделирование.
AMiner был создан как исследовательский проект в области анализа социального влияния, ранжирования социальных сетей и извлечения информации из социальных сетей. По результатам разработки системы был опубликован ряд рецензируемых статей. Он работает уже более трех лет и проиндексировал 130 000 000 исследователей и более 265 миллионов публикаций. [2] Исследование финансировалось Китайской национальной программой исследований и разработок в области высоких технологий и Национальным научным фондом Китая .
AMiner обычно используется в научных кругах для выявления взаимосвязей между исследованиями и исследователями и построения статистических корреляций. Он привлек более 10 миллионов независимых IP-доступов из 220 стран и регионов. Продукт использовался на Elsevier . платформе SciVerse компании [3] и научные конференции, такие как SIGKDD, ICDM, PKDD, WSDM.
Операция
[ редактировать ]AMiner автоматически извлекает профиль исследователя из Интернета. Он собирает и идентифицирует соответствующие страницы, а затем использует единый подход для извлечения данных из идентифицированных документов. Он также извлекает публикации из цифровых онлайн-библиотек, используя эвристические правила.
Он объединяет извлеченные профили исследователей и извлеченные публикации. В качестве идентификатора используется имя исследователя. Была предложена вероятностная структура для решения проблемы неоднозначности имен при интеграции. Интегрированные данные сохраняются в базе знаний исследовательской сети (РНКБ).
Другими основными продуктами в этой области являются Google Scholar, Scirus от Elsevier и проект с открытым исходным кодом CiteSeer.
История
[ редактировать ]Его инициировал и создал профессор Цзе Тан из Университета Цинхуа , Китай. Впервые он был запущен в марте 2006 года. Ниже приводится список обновлений за последние годы:
- Март 2006 г., версия 0.1. Функции включают профилирование исследователей, поиск экспертов, поиск по конференциям и поиск публикаций. Система была разработана на Perl;
- Август 2006 г., версия 1.0. Система переработана на Java;
- Июль 2007 г., версия 2.0. Новые функции включают анализ интересов исследователей, поиск ассоциаций, поиск опросных листов (сейчас недоступно);
- Апрель 2008 г., версия 3.0. Новые функции включают понимание запросов , новый графический интерфейс пользователя и анализ журнала поиска;
- Ноябрь 2008 г., версия 4.0. Новые функции включают поиск по графам, тематическое моделирование, извлечение информации о финансировании NSF/NSFC;
- Апрель 2009 г., версия 5.0. Новые функции включают редактирование профиля, службу открытого API, поиск Bole, поиск курсов (сейчас недоступен);
- Декабрь 2009 г., версия 6.0. Новые функции включают оценку академической успеваемости, отзывы пользователей, анализ конференций;
- Май 2010 г., версия 7.0. Новые функции включают устранение неоднозначности имени, рекомендации рецензента, создание ArnetPage;
- Март 2012 года, версия II, переименованная в AMiner, переписала все коды и изменила дизайн графического интерфейса. Новые функции включают в себя: географический поиск, платформу ArnetAPP.
- Июнь 2014 года, версия II, переименованная в AMiner, переписала все коды и изменила дизайн графического интерфейса. Новые функции включают в себя: географический поиск, платформу ArnetAPP.
- В декабре 2015 года в сети появилась совершенно новая версия.
- В мае 2017 г. в сети появилась профессиональная версия.
- Апрель 2018 г. Новые функции включают анализ тенденций, [4] на основе глубокого обучения устранение неоднозначности имени [5]
Ресурсы
[ редактировать ]AMiner опубликовал несколько наборов данных для целей академических исследований, в том числе Open Academic Graph, [6] ДБЛП+цитирование [7] (набор данных, дополняющий цитаты в данные DBLP из проекта цифровой библиографии и библиотеки ), устранение неоднозначности имени, [8] Анализ социальных связей. [9] Дополнительные доступные наборы данных и исходные коды для исследований см. [10]
См. также
[ редактировать ]- Список академических баз данных и поисковых систем
- CiteSeerX
- Цифровая библиография и библиотечный проект
- Google Академика
- Академический поиск Microsoft
- Скирус
- Скопус
- ОпенАлекс
Ссылки
[ редактировать ]- ^ Цзе Тан; Цзин Чжан; Лиминь Яо; Хуанзи Ли; Ли Чжан; Чжун Су (2008). «АрнетМайнер» . Материалы 14-й международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных . Нью-Йорк: ACM. стр. 990–998. дои : 10.1145/1401890.1402008 . ISBN 9781605581934 . S2CID 3348552 .
- ^ «Арнетмайнер: введение» . Проверено 17 декабря 2020 г.
- ^ «SciVerse – HUB – Главная» . Архивировано из оригинала 9 сентября 2012 года . Проверено 24 апреля 2012 г.
- ^ «Трендовый анализ» . Проверено 24 декабря 2018 г.
- ^ Ютао Чжан; Фаньцзинь Чжан; Пейран Яо; Цзе Тан (2018). «Устранение неоднозначности имени в AMiner» . Материалы 24-й Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных . Лондон: ACM. стр. 1002–1011. дои : 10.1145/3219819.3219859 . ISBN 9781450355520 . S2CID 207579405 .
- ^ «Открытый академический график» . Проверено 24 декабря 2018 г.
- ^ «Статьи DBLP + взаимосвязь цитирования» . Проверено 24 декабря 2018 г.
- ^ «Уточнение имени» . Проверено 24 апреля 2012 г.
- ^ «Выявление социальных связей в больших сетях» . Проверено 24 апреля 2012 г.
- ^ «Открытые данные и коды ArnetMiner» . Проверено 24 апреля 2012 г.
Внешние ссылки
[ редактировать ]- AMiner.org ( Arnetminer.org сейчас заархивирован)
- AMiner.cn
Дальнейшее чтение
[ редактировать ]- Цзе Тан, Цзин Чжан, Лиминь Яо, Хуаньцзы Ли, Ли Чжан, Чжун Су. Arnetminer: добыча и майнинг академических социальных сетей. В материалах 14-й международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных (SIGKDD'2008).
- Чи Ван, Цзявэй Хан , Юньтао Цзя, Цзе Тан , Дуо Чжан, Иньтао Ю и Цзинъи Го. Взаимоотношения советников по горнодобывающей промышленности и сетей исследовательских публикаций. В материалах шестнадцатой Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных (SIGKDD'2010).
- Цзе Тан , Джимэн Сун, Чи Ван и Цзы Ян. Анализ социального влияния в крупномасштабных сетях. В материалах пятнадцатой Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных (SIGKDD'2009). стр. 807–816.
- Цзе Тан , Руомин Цзинь и Цзин Чжан. Подход к тематическому моделированию и его интеграция в структуру случайного блуждания для академического поиска. В материалах Международной конференции IEEE по интеллектуальному анализу данных (ICDM'2008) за 2008 год. стр. 1055–1060.
- Цзе Тан , Лиминь Яо, Дуо Чжан и Цзин Чжан. Комбинированный подход к профилированию веб-пользователей. Транзакции ACM по обнаружению знаний из данных (TKDD), (том 5, № 1), статья 2 (декабрь 2010 г.), 44 страницы.
- Ютао Чжан, Фаньцзинь Чжан, Пейран Яо и Цзе Тан . Устранение неоднозначности имен в AMiner: кластеризация, обслуживание и участие человека в цикле. В материалах двадцать четвертой Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных (KDD'18). стр. 1002-1011.