Jump to content

AMiner (база данных)

Амины
Тип сайта
Библиографическая база данных
Владелец Университет Цинхуа
URL-адрес www амины .org
Регистрация Необязательный
Запущен март 2006 г .; 18 лет назад ( 2006-03 )
Текущий статус Активный

AMiner (ранее ArnetMiner ) — бесплатный онлайн-сервис, используемый для индексации, поиска и анализа больших научных данных .

AMiner (ArnetMiner) предназначен для поиска и выполнения по интеллектуальному анализу данных операций научных публикаций в Интернете , используя анализ социальных сетей для выявления связей между исследователями, конференциями и публикациями. [1] Это позволяет ему предоставлять такие услуги, как поиск экспертов, географический поиск, анализ тенденций, рекомендации рецензентов, поиск ассоциаций, поиск курсов, оценка академической успеваемости и тематическое моделирование.

AMiner был создан как исследовательский проект в области анализа социального влияния, ранжирования социальных сетей и извлечения информации из социальных сетей. По результатам разработки системы был опубликован ряд рецензируемых статей. Он работает уже более трех лет и проиндексировал 130 000 000 исследователей и более 265 миллионов публикаций. [2] Исследование финансировалось Китайской национальной программой исследований и разработок в области высоких технологий и Национальным научным фондом Китая .

AMiner обычно используется в научных кругах для выявления взаимосвязей между исследованиями и исследователями и построения статистических корреляций. Он привлек более 10 миллионов независимых IP-доступов из 220 стран и регионов. Продукт использовался на Elsevier . платформе SciVerse компании [3] и научные конференции, такие как SIGKDD, ICDM, PKDD, WSDM.

Операция

[ редактировать ]

AMiner автоматически извлекает профиль исследователя из Интернета. Он собирает и идентифицирует соответствующие страницы, а затем использует единый подход для извлечения данных из идентифицированных документов. Он также извлекает публикации из цифровых онлайн-библиотек, используя эвристические правила.

Он объединяет извлеченные профили исследователей и извлеченные публикации. В качестве идентификатора используется имя исследователя. Была предложена вероятностная структура для решения проблемы неоднозначности имен при интеграции. Интегрированные данные сохраняются в базе знаний исследовательской сети (РНКБ).

Другими основными продуктами в этой области являются Google Scholar, Scirus от Elsevier и проект с открытым исходным кодом CiteSeer.

Его инициировал и создал профессор Цзе Тан из Университета Цинхуа , Китай. Впервые он был запущен в марте 2006 года. Ниже приводится список обновлений за последние годы:

  • Март 2006 г., версия 0.1. Функции включают профилирование исследователей, поиск экспертов, поиск по конференциям и поиск публикаций. Система была разработана на Perl;
  • Август 2006 г., версия 1.0. Система переработана на Java;
  • Июль 2007 г., версия 2.0. Новые функции включают анализ интересов исследователей, поиск ассоциаций, поиск опросных листов (сейчас недоступно);
  • Апрель 2008 г., версия 3.0. Новые функции включают понимание запросов , новый графический интерфейс пользователя и анализ журнала поиска;
  • Ноябрь 2008 г., версия 4.0. Новые функции включают поиск по графам, тематическое моделирование, извлечение информации о финансировании NSF/NSFC;
  • Апрель 2009 г., версия 5.0. Новые функции включают редактирование профиля, службу открытого API, поиск Bole, поиск курсов (сейчас недоступен);
  • Декабрь 2009 г., версия 6.0. Новые функции включают оценку академической успеваемости, отзывы пользователей, анализ конференций;
  • Май 2010 г., версия 7.0. Новые функции включают устранение неоднозначности имени, рекомендации рецензента, создание ArnetPage;
  • Март 2012 года, версия II, переименованная в AMiner, переписала все коды и изменила дизайн графического интерфейса. Новые функции включают в себя: географический поиск, платформу ArnetAPP.
  • Июнь 2014 года, версия II, переименованная в AMiner, переписала все коды и изменила дизайн графического интерфейса. Новые функции включают в себя: географический поиск, платформу ArnetAPP.
  • В декабре 2015 года в сети появилась совершенно новая версия.
  • В мае 2017 г. в сети появилась профессиональная версия.
  • Апрель 2018 г. Новые функции включают анализ тенденций, [4] на основе глубокого обучения устранение неоднозначности имени [5]

AMiner опубликовал несколько наборов данных для целей академических исследований, в том числе Open Academic Graph, [6] ДБЛП+цитирование [7] (набор данных, дополняющий цитаты в данные DBLP из проекта цифровой библиографии и библиотеки ), устранение неоднозначности имени, [8] Анализ социальных связей. [9] Дополнительные доступные наборы данных и исходные коды для исследований см. [10]

См. также

[ редактировать ]
  1. ^ Цзе Тан; Цзин Чжан; Лиминь Яо; Хуанзи Ли; Ли Чжан; Чжун Су (2008). «АрнетМайнер» . Материалы 14-й международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных . Нью-Йорк: ACM. стр. 990–998. дои : 10.1145/1401890.1402008 . ISBN  9781605581934 . S2CID   3348552 .
  2. ^ «Арнетмайнер: введение» . Проверено 17 декабря 2020 г.
  3. ^ «SciVerse – HUB – Главная» . Архивировано из оригинала 9 сентября 2012 года . Проверено 24 апреля 2012 г.
  4. ^ «Трендовый анализ» . Проверено 24 декабря 2018 г.
  5. ^ Ютао Чжан; Фаньцзинь Чжан; Пейран Яо; Цзе Тан (2018). «Устранение неоднозначности имени в AMiner» . Материалы 24-й Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных . Лондон: ACM. стр. 1002–1011. дои : 10.1145/3219819.3219859 . ISBN  9781450355520 . S2CID   207579405 .
  6. ^ «Открытый академический график» . Проверено 24 декабря 2018 г.
  7. ^ «Статьи DBLP + взаимосвязь цитирования» . Проверено 24 декабря 2018 г.
  8. ^ «Уточнение имени» . Проверено 24 апреля 2012 г.
  9. ^ «Выявление социальных связей в больших сетях» . Проверено 24 апреля 2012 г.
  10. ^ «Открытые данные и коды ArnetMiner» . Проверено 24 апреля 2012 г.
[ редактировать ]

Дальнейшее чтение

[ редактировать ]
  • Цзе Тан, Цзин Чжан, Лиминь Яо, Хуаньцзы Ли, Ли Чжан, Чжун Су. Arnetminer: добыча и майнинг академических социальных сетей. В материалах 14-й международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных (SIGKDD'2008).
  • Чи Ван, Цзявэй Хан , Юньтао Цзя, Цзе Тан , Дуо Чжан, Иньтао Ю и Цзинъи Го. Взаимоотношения советников по горнодобывающей промышленности и сетей исследовательских публикаций. В материалах шестнадцатой Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных (SIGKDD'2010).
  • Цзе Тан , Джимэн Сун, Чи Ван и Цзы Ян. Анализ социального влияния в крупномасштабных сетях. В материалах пятнадцатой Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных (SIGKDD'2009). стр. 807–816.
  • Цзе Тан , Руомин Цзинь и Цзин Чжан. Подход к тематическому моделированию и его интеграция в структуру случайного блуждания для академического поиска. В материалах Международной конференции IEEE по интеллектуальному анализу данных (ICDM'2008) за 2008 год. стр. 1055–1060.
  • Цзе Тан , Лиминь Яо, Дуо Чжан и Цзин Чжан. Комбинированный подход к профилированию веб-пользователей. Транзакции ACM по обнаружению знаний из данных (TKDD), (том 5, № 1), статья 2 (декабрь 2010 г.), 44 страницы.
  • Ютао Чжан, Фаньцзинь Чжан, Пейран Яо и Цзе Тан . Устранение неоднозначности имен в AMiner: кластеризация, обслуживание и участие человека в цикле. В материалах двадцать четвертой Международной конференции ACM SIGKDD по обнаружению знаний и интеллектуальному анализу данных (KDD'18). стр. 1002-1011.
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d9439f451330030f77b0dab1d0858c6f__1712010540
URL1:https://arc.ask3.ru/arc/aa/d9/6f/d9439f451330030f77b0dab1d0858c6f.html
Заголовок, (Title) документа по адресу, URL1:
AMiner (database) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)