Семантический ученый
Тип сайта | Поисковая система |
---|---|
Создано | Институт искусственного интеллекта Аллена |
URL-адрес | ученый-семантик |
Запущен | 2 ноября 2015 г [1] |
Semantic Scholar — это инструмент исследования научной литературы, основанный на искусственном интеллекте . Он разработан в Институте искусственного интеллекта Аллена и был публично выпущен в ноябре 2015 года. [2] Semantic Scholar использует современные методы обработки естественного языка для поддержки исследовательского процесса, например, предоставляя автоматически генерируемые резюме научных статей. [3] Команда Semantic Scholar активно исследует использование искусственного интеллекта в обработке естественного языка , машинном обучении , взаимодействии человека с компьютером и поиске информации . [4]
Semantic Scholar начинался как база данных по информатике , геонаукам и нейробиологии . [5] В 2017 году система начала включать биомедицинскую литературу . в свой корпус [5] По состоянию на сентябрь 2022 г. [update], он включает более 200 миллионов публикаций из всех областей науки. [6]
Технология [ править ]
в одном предложении Semantic Scholar предоставляет краткое изложение научной литературы . Одной из его целей было решение проблемы чтения многочисленных названий и длинных рефератов на мобильных устройствах. [7] Он также стремится обеспечить, чтобы три миллиона научных статей, публикуемых ежегодно, доходили до читателей, поскольку, по оценкам, только половина этой литературы когда-либо читается. [8]
Искусственный интеллект используется для того, чтобы уловить суть статьи, генерируя ее с помощью «абстрактной» техники. [3] В проекте используется комбинация машинного обучения , обработки естественного языка и машинного зрения , чтобы добавить уровень семантического анализа к традиционным методам анализа цитирования , а также извлечь из статей соответствующие цифры, таблицы , объекты и места проведения. [9] [10]
Еще одна ключевая функция, основанная на искусственном интеллекте, — это Research Feeds, адаптивный рекомендатель исследований, который использует искусственный интеллект, чтобы быстро узнать, какие статьи интересуют пользователей, и рекомендует последние исследования, чтобы помочь ученым оставаться в курсе событий. Он использует современную модель встраивания бумаги, обученную с помощью контрастного обучения, чтобы находить документы, похожие на те, что находятся в каждой папке библиотеки. [11]
Semantic Scholar также предлагает Semantic Reader, расширенную программу чтения, способную совершить революцию в научном чтении, сделав его более доступным и контекстуальным. [12] Semantic Reader предоставляет встроенные карточки цитирования, которые позволяют пользователям видеть цитаты с резюме TLDR во время чтения и просматривать основные моменты, отражающие ключевые моменты статьи, чтобы пользователи могли быстрее ее переваривать.
В отличие от Google Scholar и PubMed , Semantic Scholar предназначен для выделения наиболее важных и влиятельных элементов статьи. [13] Технология искусственного интеллекта предназначена для выявления скрытых связей и связей между темами исследований. [14] Как и ранее упомянутые поисковые системы, Semantic Scholar также использует графовые структуры, в том числе Microsoft Academic Knowledge Graph , Springer Nature's SciGraph и Semantic Scholar Corpus. [15]
Семантический идентификатор ученого [ править ]
Каждой статье, размещенной на Semantic Scholar, присваивается уникальный идентификатор , называемый Semantic Scholar Corpus ID (сокращенно S2CID). Следующая запись является примером:
Лю, Ин; Гейл, Альберт А; Уайлдер-Смит, Аннелис; Роклов, Иоаким (март 2020 г.). «Репродуктивная численность COVID-19 выше по сравнению с коронавирусом SARS». Журнал туристической медицины . 27 (2). дои : 10.1093/jtm/taaa021 . ПМИД 32052846 . S2CID 211099356 .
Индексация [ править ]
Semantic Scholar можно использовать бесплатно, и в отличие от аналогичных поисковых систем (например, Google Scholar ) он не ищет материалы, находящиеся за платным доступом . [5] [ нужна ссылка ]
В одном исследовании объем индекса Semantic Scholar сравнивался с Google Scholar, и было обнаружено, что для статей, цитируемых вторичными исследованиями в области компьютерных наук, оба индекса имели сопоставимый охват, каждый из которых пропускал лишь несколько статей. [16]
Количество пользователей и публикаций [ править ]
По состоянию на январь 2018 года, после проекта 2017 года, в который были добавлены биомедицинские статьи и краткие описания тем, корпус Semantic Scholar включал более 40 миллионов статей по информатике и биомедицине . [17] В марте 2018 года Дуг Рэймонд, который разработал по машинному обучению инициативы для платформы Amazon Alexa , был нанят руководителем проекта Semantic Scholar. [18] По состоянию на август 2019 г. [update]количество включенных метаданных статей (а не самих PDF-файлов) выросло до более чем 173 миллионов. [19] после добавления записей Microsoft Academic Graph . [20] В 2020 году в результате партнерства между Semantic Scholar и University of Chicago Press Journals все статьи, опубликованные в University of Chicago Press, стали доступны в корпусе Semantic Scholar. [21] По состоянию на конец 2020 года Semantic Scholar проиндексировал 190 миллионов статей. [22] В 2020 году Semantic Scholar достиг семи миллионов пользователей в месяц. [7]
См. также [ править ]
- Анализ цитирования - изучение частоты, закономерностей и графиков цитирования в документах.
- Индекс цитирования - Индекс цитирования между публикациями.
- Извлечение знаний - создание знаний из структурированных и неструктурированных источников.
- Список академических баз данных и поисковых систем
- Наукометрика - Количественное исследование научной литературы.
Ссылки [ править ]
- ^ Джонс, Никола (2015). «Институт искусственного интеллекта запускает бесплатную поисковую систему по науке» . Природа . дои : 10.1038/nature.2015.18703 . ISSN 1476-4687 . S2CID 182440976 .
- ^ Ынджунг Ча, Ариана (3 ноября 2015 г.). «Исследовательская группа Пола Аллена по искусственному интеллекту представляет программу, цель которой — изменить способы поиска научных знаний. Попробуйте» . Вашингтон Пост . Архивировано из оригинала 6 ноября 2019 года . Проверено 3 ноября 2015 г.
- ^ Jump up to: Перейти обратно: а б Хао, Карен (18 ноября 2020 г.). «ИИ поможет вам обобщить последние достижения в области ИИ» . Обзор технологий Массачусетского технологического института . Проверено 16 февраля 2021 г.
- ^ «Семантические научные исследования» . Research.semanticscholar.org . Проверено 22 ноября 2021 г.
- ^ Jump up to: Перейти обратно: а б с Фрике, Сюзанна (12 января 2018 г.). «Семантический ученый» . Журнал Ассоциации медицинских библиотек . 106 (1): 145–147. дои : 10.5195/jmla.2018.280 . ISSN 1558-9439 . ПМЦ 5764585 . S2CID 45802944 .
- ^ Мэтьюз, Дэвид (1 сентября 2021 г.). «Тонете в литературе? Эти умные программные инструменты могут помочь» . Природа . Проверено 5 сентября 2022 г.
…публично доступный корпус, составленный Semantic Scholar — инструментом, созданным в 2015 году Институтом искусственного интеллекта Аллена в Сиэтле, штат Вашингтон — насчитывает около 200 миллионов статей, включая препринты.
- ^ Jump up to: Перейти обратно: а б Град, Питер (24 ноября 2020 г.). «Инструмент искусственного интеллекта обобщает длинные статьи в одном предложении» . Техэксплор . Проверено 16 февраля 2021 г.
- ^ «Ученый-семантик Института Аллена теперь осуществляет поиск по 175 миллионам научных статей» . ВенчурБит . 2019-10-23 . Проверено 16 февраля 2021 г.
- ^ Боханнон, Джон (11 ноября 2016 г.). «Компьютерная программа только что составила рейтинг самых влиятельных ученых-исследователей мозга современной эпохи» . Наука . дои : 10.1126/science.aal0371 . Архивировано из оригинала 29 апреля 2020 года . Проверено 12 ноября 2016 г. .
- ^ Кристофер Кларк; Сантош Диввала (2016), PDFFigures 2.0: Цифры майнинга из исследовательских работ , Материалы 16-й ACM/IEEE-CS по совместной конференции по цифровым библиотекам - JCDL '16, Wikidata Q108172042
- ^ «Семантический ученый | Часто задаваемые вопросы» . Архивировано из оригинала 15 июля 2023 года.
- ^ «Семантический ученый | Семантический читатель» . Семантический учёный . Архивировано из оригинала 15 июля 2023 года.
- ^ «Семантический ученый» . Международный журнал языковых и литературных исследований . Проверено 9 ноября 2021 г.
- ^ Байкучева, Светла (2021). Стимулирование открытия научной информации в эпоху цифровых технологий . Издательство Чандос. п. 91. ИСБН 978-0-12-823724-3 .
- ^ Хосе, Джоемон М.; Йылмаз, Эмине; Магальяйнс, Жуан; Кастельс, Пабло; Ферро, Никола; Сильва, Марио Х.; Мартинс, Флавио (2020). Достижения в области информационного поиска: 42-я Европейская конференция по IR-исследованиям, ECIR 2020, Лиссабон, Португалия, 14–17 апреля 2020 г., Материалы, Часть I. Чам, Швейцария: Springer Nature. п. 254. ИСБН 978-3-030-45438-8 .
- ^ Ханнусс, Абдельхаким (2021). «Поиск соответствующих документов для вторичных исследований в области разработки программного обеспечения: охват семантического ученого и роль идентификации» . Программное обеспечение ИЭПП . 15 (1): 126–146. дои : 10.1049/sfw2.12011 . ISSN 1751-8814 . S2CID 234053002 .
- ^ «AI2 расширяет поисковую систему Semantic Scholar, чтобы охватить биомедицинские исследования» . GeekWire . 17 октября 2017 г. Архивировано из оригинала 19 января 2018 г. Проверено 18 января 2018 г.
- ^ «Технические шаги: Институт Аллена нанимает лидера по машинному обучению Amazon Alexa; председатель Microsoft берет на себя роль нового инвестора и многое другое» . GeekWire. 2018-05-02. Архивировано из оригинала 10 мая 2018 г. Проверено 9 мая 2018 г.
- ^ «Семантический ученый» . Семантический учёный . Архивировано из оригинала 11 августа 2019 года . Проверено 11 августа 2019 г.
- ^ «AI2 объединяет усилия с Microsoft Research для обновления инструментов поиска для научных исследований» . GeekWire . 05.12.2018. Архивировано из оригинала 25 августа 2019 г. Проверено 25 августа 2019 г.
- ^ «Издательство Чикагского университета присоединяется к более чем 500 издателям, работающим с Semantic Scholar над улучшением поиска и доступности» . Компания RCNI Limited . Проверено 22 ноября 2021 г.
- ^ Данн, Адриана (14 декабря 2020 г.). «Семантический ученый добавил 25 миллионов научных статей в 2020 году благодаря новым партнерским отношениям с издателями» (PDF) . Семантический учёный . Проверено 22 ноября 2021 г.
Внешние ссылки [ править ]
- Идентификатор темы Semantic Scholar (P6611) (см. раздел «Использование » )
- Идентификатор автора Semantic Scholar (P4012) (см. раздел «Использование » )
- Идентификатор корпуса Semantic Scholar (P8299) (см. раздел «Использование » )
- Идентификатор статьи Semantic Scholar (P4011) (см. раздел «Использование »)