Бесконечное изучение языка
Бесконечная система изучения языка ( NELL ) — это семантического машинного обучения система , которая по состоянию на 2010 год разрабатывалась исследовательской группой из Университета Карнеги-Меллон и поддерживается грантами DARPA , Google , NSF и CNPq , при этом некоторые части системы работают. на суперкомпьютерном кластере, предоставленном Yahoo! . [1]
Процесс и цели
[ редактировать ]Этот раздел необходимо обновить . ( октябрь 2023 г. ) |
Разработчики NELL запрограммировали его таким образом, чтобы он мог идентифицировать базовый набор фундаментальных семантических отношений между несколькими сотнями предопределенных категорий данных, таких как города, компании, эмоции и спортивные команды. С начала 2010 года исследовательская группа Карнеги-Меллона круглосуточно управляет NELL, просматривая сотни миллионов веб-страниц в поисках связей между уже известной информацией и тем, что она находит в процессе поиска – чтобы установить новые связи в манера, призванная имитировать способ, которым люди усваивают новую информацию. [2] Например, встретив пару слов «Пайкс-Пик», NELL заметит, что оба слова написаны с заглавной буквы, и сделает вывод из второго слова, что это было название горы, а затем, опираясь на взаимосвязь слов, окружающих эти два слова, сделает вывод. другие связи. [1]
Цель NELL и других систем семантического обучения, таких как система IBM Watson , состоит в том , чтобы иметь возможность разрабатывать средства ответа на вопросы, задаваемые пользователями, на естественном языке без вмешательства человека в этот процесс. [3] Орен Эциони из Вашингтонского университета похвалил систему за «непрерывное обучение, как будто NELL проявляет любопытство самостоятельно, без особой помощи человека». [1]
К октябрю 2010 года NELL удвоила количество связей, имеющихся в ее базе знаний, и узнала 440 000 новых фактов с точностью 87%. [4] [1] Руководитель группы Том М. Митчелл , председатель отдела машинного обучения в Карнеги-Меллоне, описал, как NELL «самокорректируется, когда у нее есть больше информации, по мере того, как она узнает больше», хотя иногда она приходит к неверным выводам. Накопленные ошибки, такие как вывод о том, что файлы cookie Интернета являются своего рода выпечкой, привели к тому, что NELL на основе фраз «Я удалил файлы cookie Интернета» и «Я удалил свои файлы» заключила, что « компьютерные файлы » также относятся к категории хлебобулочных изделий. . [5] Очистить такие ошибки [ когда? ] каждые несколько недель исправляются членами исследовательской группы, и системе разрешается продолжить процесс обучения. [1] К 2018 году NELL «приобрела базу знаний со 120 миллионами разнообразных, взвешенных по доверию убеждений (например, подается с (чай, печенье) ), одновременно изучая тысячи взаимосвязанных функций, которые со временем постоянно улучшают ее навыки чтения». [6]
По состоянию на сентябрь 2023 года самые последние собранные проектом факты датированы февралем 2019 года (согласно его ленте в Твиттере). [7] или сентябрь 2018 г. (согласно домашней странице). [8]
Прием
[ редактировать ]В своей книге « Совместимость с человеком » 2019 года Стюарт Рассел прокомментировал: «К сожалению, NELL доверяет только 3 процентам своих убеждений и полагается на экспертов-людей, которые регулярно вычищают ложные или бессмысленные убеждения, например, убеждения, что «Непал страна, также известная как Соединенные Штаты» и «стоимость — это сельскохозяйственный продукт, который обычно разделяется на базис». [9] В документе 2023 года отмечалось: «Хотя бесконечная часть кажется правильным подходом, у NELL все же был недостаток: ее внимание оставалось слишком основанным на описаниях на объектном языке и полагалось на веб-страницы как на единственный источник, что существенно повлияло на анализируются тип грамматики, символики, сленга и т. д.». [10]
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Jump up to: а б с д и «Стремясь учиться так же, как мы, машина учится сама» . Нью-Йорк Таймс . 4 октября 2010 г. Проверено 5 октября 2010 г.
С начала года группа исследователей из Университета Карнеги-Меллон при поддержке грантов Агентства перспективных исследовательских проектов Министерства обороны и Google, а также использования исследовательского суперкомпьютерного кластера, предоставленного Yahoo, настраивала компьютерную систему, которая пытаясь освоить семантику, обучаясь больше как человек.
- ^ Обзор проекта , Университет Карнеги-Меллона . По состоянию на 5 октября 2010 г.
- ^ Трейдер, Тиффани. «Машины изучают язык, начиная с фактов» , HPCwire, 5 октября 2010 г. По состоянию на 5 октября 2010 г.
- ^ «NELL: Бесконечное изучение языка» , Университет Карнеги-Меллона . По состоянию на 5 октября 2010 г.
- ^ ВанХемерт, Кайл. «Прямо сейчас компьютер читает онлайн, изучая язык» , Gizmodo , 6 октября 2010 г. По состоянию на 5 октября 2010 г.
- ^ Митчелл, Т.; Коэн, В.; Грушка, Э.; Талукдар, П.; Ян, Б.; Беттеридж, Дж.; Карлсон, А.; Далви, Б.; Гарднер, М.; Кисель, Б.; Кришнамурти, Дж.; Лао, Н.; Мазайтис, К.; Мохамед, Т.; Накашоле, Н. (24 апреля 2018 г.). «Бесконечное обучение» . Коммуникации АКМ . 61 (5): 103–115. дои : 10.1145/3191513 . ISSN 0001-0782 .
- ^ «НЭЛЛ (@cmunell) | Твиттер» . Твиттер.com . Проверено 4 сентября 2023 г.
- ^ «Читайте в Интернете:: Университет Карнеги-Меллон» . rtw.ml.cmu.edu . Проверено 4 сентября 2023 г.
- ^ Рассел, Стюарт (2019). «3». Совместимость с человеком: ИИ и проблема управления . Аллен Лейн.
- ^ де Ягер, С. (11 апреля 2023 г.). «Семантический шум в схеме Винограда, задача устранения неоднозначности местоимений» . Гуманитарные и социальные науки. Коммуникации . 10 (1): 1–1 дои : 10.1057/ s41599-023-01643-9 ISSN 2662-9992 .