Бесконечное изучение языка

Бесконечная система изучения языка ( NELL ) — это семантического машинного обучения система , которая по состоянию на 2010 год разрабатывалась исследовательской группой из Университета Карнеги-Меллон и поддерживается грантами DARPA , Google , NSF и CNPq , при этом некоторые части системы работают. на суперкомпьютерном кластере, предоставленном Yahoo! . ^[1]

Процесс и цели

Разработчики NELL запрограммировали его таким образом, чтобы он мог идентифицировать базовый набор фундаментальных семантических отношений между несколькими сотнями предопределенных категорий данных, таких как города, компании, эмоции и спортивные команды. С начала 2010 года исследовательская группа Карнеги-Меллона круглосуточно управляет NELL, просматривая сотни миллионов веб-страниц в поисках связей между уже известной информацией и тем, что она находит в процессе поиска – чтобы установить новые связи в манера, призванная имитировать способ, которым люди усваивают новую информацию. ^[2] Например, встретив пару слов «Пайкс-Пик», NELL заметит, что оба слова написаны с заглавной буквы, и сделает вывод из второго слова, что это было название горы, а затем, опираясь на взаимосвязь слов, окружающих эти два слова, сделает вывод. другие связи. ^[1]

Цель NELL и других систем семантического обучения, таких как система IBM Watson , состоит в том , чтобы иметь возможность разрабатывать средства ответа на вопросы, задаваемые пользователями, на естественном языке без вмешательства человека в этот процесс. ^[3] Орен Эциони из Вашингтонского университета похвалил систему за «непрерывное обучение, как будто NELL проявляет любопытство самостоятельно, без особой помощи человека». ^[1]

К октябрю 2010 года NELL удвоила количество связей, имеющихся в ее базе знаний, и узнала 440 000 новых фактов с точностью 87%. ^[4]^[1] Руководитель группы Том М. Митчелл , председатель отдела машинного обучения в Карнеги-Меллоне, описал, как NELL «самокорректируется, когда у нее есть больше информации, по мере того, как она узнает больше», хотя иногда она приходит к неверным выводам. Накопленные ошибки, такие как вывод о том, что файлы cookie Интернета являются своего рода выпечкой, привели к тому, что NELL на основе фраз «Я удалил файлы cookie Интернета» и «Я удалил свои файлы» заключила, что « компьютерные файлы » также относятся к категории хлебобулочных изделий. . ^[5] Очистить такие ошибки ^{[ когда? ]} каждые несколько недель исправляются членами исследовательской группы, и системе разрешается продолжить процесс обучения. ^[1] К 2018 году NELL «приобрела базу знаний со 120 миллионами разнообразных, взвешенных по доверию убеждений (например, подается с (чай, печенье) ), одновременно изучая тысячи взаимосвязанных функций, которые со временем постоянно улучшают ее навыки чтения». ^[6]

По состоянию на сентябрь 2023 года самые последние собранные проектом факты датированы февралем 2019 года (согласно его ленте в Твиттере). ^[7] или сентябрь 2018 г. (согласно домашней странице). ^[8]

Прием

В своей книге « Совместимость с человеком » 2019 года Стюарт Рассел прокомментировал: «К сожалению, NELL доверяет только 3 процентам своих убеждений и полагается на экспертов-людей, которые регулярно вычищают ложные или бессмысленные убеждения, например, убеждения, что «Непал страна, также известная как Соединенные Штаты» и «стоимость — это сельскохозяйственный продукт, который обычно разделяется на базис». ^[9] В документе 2023 года отмечалось: «Хотя бесконечная часть кажется правильным подходом, у NELL все же был недостаток: ее внимание оставалось слишком основанным на описаниях на объектном языке и полагалось на веб-страницы как на единственный источник, что существенно повлияло на анализируются тип грамматики, символики, сленга и т. д.». ^[10]

См. также

Ссылки

^ Jump up to: ^а ^б ^с ^д ^и «Стремясь учиться так же, как мы, машина учится сама» . Нью-Йорк Таймс . 4 октября 2010 г. Проверено 5 октября 2010 г. С начала года группа исследователей из Университета Карнеги-Меллон при поддержке грантов Агентства перспективных исследовательских проектов Министерства обороны и Google, а также использования исследовательского суперкомпьютерного кластера, предоставленного Yahoo, настраивала компьютерную систему, которая пытаясь освоить семантику, обучаясь больше как человек.
^ Обзор проекта , Университет Карнеги-Меллона . По состоянию на 5 октября 2010 г.
^ Трейдер, Тиффани. «Машины изучают язык, начиная с фактов» , HPCwire, 5 октября 2010 г. По состоянию на 5 октября 2010 г.
^ «NELL: Бесконечное изучение языка» , Университет Карнеги-Меллона . По состоянию на 5 октября 2010 г.
^ ВанХемерт, Кайл. «Прямо сейчас компьютер читает онлайн, изучая язык» , Gizmodo , 6 октября 2010 г. По состоянию на 5 октября 2010 г.
^ Митчелл, Т.; Коэн, В.; Грушка, Э.; Талукдар, П.; Ян, Б.; Беттеридж, Дж.; Карлсон, А.; Далви, Б.; Гарднер, М.; Кисель, Б.; Кришнамурти, Дж.; Лао, Н.; Мазайтис, К.; Мохамед, Т.; Накашоле, Н. (24 апреля 2018 г.). «Бесконечное обучение» . Коммуникации АКМ . 61 (5): 103–115. дои : 10.1145/3191513 . ISSN 0001-0782 .
^ «НЭЛЛ (@cmunell) | Твиттер» . Твиттер.com . Проверено 4 сентября 2023 г.
^ «Читайте в Интернете:: Университет Карнеги-Меллон» . rtw.ml.cmu.edu . Проверено 4 сентября 2023 г.
^ Рассел, Стюарт (2019). «3». Совместимость с человеком: ИИ и проблема управления . Аллен Лейн.
^ де Ягер, С. (11 апреля 2023 г.). «Семантический шум в схеме Винограда, задача устранения неоднозначности местоимений» . Гуманитарные и социальные науки. Коммуникации . 10 (1): 1–1 дои : 10.1057/ s41599-023-01643-9 ISSN 2662-9992 .

Внешние ссылки

Домашняя страница проекта

[NYT2010-1] Jump up to: ^а ^б ^с ^д ^и «Стремясь учиться так же, как мы, машина учится сама» . Нью-Йорк Таймс . 4 октября 2010 г. Проверено 5 октября 2010 г. С начала года группа исследователей из Университета Карнеги-Меллон при поддержке грантов Агентства перспективных исследовательских проектов Министерства обороны и Google, а также использования исследовательского суперкомпьютерного кластера, предоставленного Yahoo, настраивала компьютерную систему, которая пытаясь освоить семантику, обучаясь больше как человек.

[2] Обзор проекта , Университет Карнеги-Меллона . По состоянию на 5 октября 2010 г.

[3] Трейдер, Тиффани. «Машины изучают язык, начиная с фактов» , HPCwire, 5 октября 2010 г. По состоянию на 5 октября 2010 г.

[4] «NELL: Бесконечное изучение языка» , Университет Карнеги-Меллона . По состоянию на 5 октября 2010 г.

[5] ВанХемерт, Кайл. «Прямо сейчас компьютер читает онлайн, изучая язык» , Gizmodo , 6 октября 2010 г. По состоянию на 5 октября 2010 г.

[6] Митчелл, Т.; Коэн, В.; Грушка, Э.; Талукдар, П.; Ян, Б.; Беттеридж, Дж.; Карлсон, А.; Далви, Б.; Гарднер, М.; Кисель, Б.; Кришнамурти, Дж.; Лао, Н.; Мазайтис, К.; Мохамед, Т.; Накашоле, Н. (24 апреля 2018 г.). «Бесконечное обучение» . Коммуникации АКМ . 61 (5): 103–115. дои : 10.1145/3191513 . ISSN 0001-0782 .

[7] «НЭЛЛ (@cmunell) | Твиттер» . Твиттер.com . Проверено 4 сентября 2023 г.

[8] «Читайте в Интернете:: Университет Карнеги-Меллон» . rtw.ml.cmu.edu . Проверено 4 сентября 2023 г.

[9] Рассел, Стюарт (2019). «3». Совместимость с человеком: ИИ и проблема управления . Аллен Лейн.

[10] де Ягер, С. (11 апреля 2023 г.). «Семантический шум в схеме Винограда, задача устранения неоднозначности местоимений» . Гуманитарные и социальные науки. Коммуникации . 10 (1): 1–1 дои : 10.1057/ s41599-023-01643-9 ISSN 2662-9992 .

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]