Jump to content

Бесконечное изучение языка

Бесконечная система изучения языка ( NELL ) — это семантического машинного обучения система , которая по состоянию на 2010 год разрабатывалась исследовательской группой из Университета Карнеги-Меллон и поддерживается грантами DARPA , Google , NSF и CNPq , при этом некоторые части системы работают. на суперкомпьютерном кластере, предоставленном Yahoo! . [1]

Процесс и цели

[ редактировать ]

Разработчики NELL запрограммировали его таким образом, чтобы он мог идентифицировать базовый набор фундаментальных семантических отношений между несколькими сотнями предопределенных категорий данных, таких как города, компании, эмоции и спортивные команды. С начала 2010 года исследовательская группа Карнеги-Меллона круглосуточно управляет NELL, просматривая сотни миллионов веб-страниц в поисках связей между уже известной информацией и тем, что она находит в процессе поиска – чтобы установить новые связи в манера, призванная имитировать способ, которым люди усваивают новую информацию. [2] Например, встретив пару слов «Пайкс-Пик», NELL заметит, что оба слова написаны с заглавной буквы, и сделает вывод из второго слова, что это было название горы, а затем, опираясь на взаимосвязь слов, окружающих эти два слова, сделает вывод. другие связи. [1]

Цель NELL и других систем семантического обучения, таких как система IBM Watson , состоит в том , чтобы иметь возможность разрабатывать средства ответа на вопросы, задаваемые пользователями, на естественном языке без вмешательства человека в этот процесс. [3] Орен Эциони из Вашингтонского университета похвалил систему за «непрерывное обучение, как будто NELL проявляет любопытство самостоятельно, без особой помощи человека». [1]

К октябрю 2010 года NELL удвоила количество связей, имеющихся в ее базе знаний, и узнала 440 000 новых фактов с точностью 87%. [4] [1] Руководитель группы Том М. Митчелл , председатель отдела машинного обучения в Карнеги-Меллоне, описал, как NELL «самокорректируется, когда у нее есть больше информации, по мере того, как она узнает больше», хотя иногда она приходит к неверным выводам. Накопленные ошибки, такие как вывод о том, что файлы cookie Интернета являются своего рода выпечкой, привели к тому, что NELL на основе фраз «Я удалил файлы cookie Интернета» и «Я удалил свои файлы» заключила, что « компьютерные файлы » также относятся к категории хлебобулочных изделий. . [5] Очистить такие ошибки [ когда? ] каждые несколько недель исправляются членами исследовательской группы, и системе разрешается продолжить процесс обучения. [1] К 2018 году NELL «приобрела базу знаний со 120 миллионами разнообразных, взвешенных по доверию убеждений (например, подается с (чай, печенье) ), одновременно изучая тысячи взаимосвязанных функций, которые со временем постоянно улучшают ее навыки чтения». [6]

По состоянию на сентябрь 2023 года самые последние собранные проектом факты датированы февралем 2019 года (согласно его ленте в Твиттере). [7] или сентябрь 2018 г. (согласно домашней странице). [8]

В своей книге « Совместимость с человеком » 2019 года Стюарт Рассел прокомментировал: «К сожалению, NELL доверяет только 3 процентам своих убеждений и полагается на экспертов-людей, которые регулярно вычищают ложные или бессмысленные убеждения, например, убеждения, что «Непал страна, также известная как Соединенные Штаты» и «стоимость — это сельскохозяйственный продукт, который обычно разделяется на базис». [9] В документе 2023 года отмечалось: «Хотя бесконечная часть кажется правильным подходом, у NELL все же был недостаток: ее внимание оставалось слишком основанным на описаниях на объектном языке и полагалось на веб-страницы как на единственный источник, что существенно повлияло на анализируются тип грамматики, символики, сленга и т. д.». [10]

См. также

[ редактировать ]
  1. ^ Jump up to: а б с д и «Стремясь учиться так же, как мы, машина учится сама» . Нью-Йорк Таймс . 4 октября 2010 г. Проверено 5 октября 2010 г. С начала года группа исследователей из Университета Карнеги-Меллон при поддержке грантов Агентства перспективных исследовательских проектов Министерства обороны и Google, а также использования исследовательского суперкомпьютерного кластера, предоставленного Yahoo, настраивала компьютерную систему, которая пытаясь освоить семантику, обучаясь больше как человек.
  2. ^ Обзор проекта , Университет Карнеги-Меллона . По состоянию на 5 октября 2010 г.
  3. ^ Трейдер, Тиффани. «Машины изучают язык, начиная с фактов» , HPCwire, 5 октября 2010 г. По состоянию на 5 октября 2010 г.
  4. ^ «NELL: Бесконечное изучение языка» , Университет Карнеги-Меллона . По состоянию на 5 октября 2010 г.
  5. ^ ВанХемерт, Кайл. «Прямо сейчас компьютер читает онлайн, изучая язык» , Gizmodo , 6 октября 2010 г. По состоянию на 5 октября 2010 г.
  6. ^ Митчелл, Т.; Коэн, В.; Грушка, Э.; Талукдар, П.; Ян, Б.; Беттеридж, Дж.; Карлсон, А.; Далви, Б.; Гарднер, М.; Кисель, Б.; Кришнамурти, Дж.; Лао, Н.; Мазайтис, К.; Мохамед, Т.; Накашоле, Н. (24 апреля 2018 г.). «Бесконечное обучение» . Коммуникации АКМ . 61 (5): 103–115. дои : 10.1145/3191513 . ISSN   0001-0782 .
  7. ^ «НЭЛЛ (@cmunell) | Твиттер» . Твиттер.com . Проверено 4 сентября 2023 г.
  8. ^ «Читайте в Интернете:: Университет Карнеги-Меллон» . rtw.ml.cmu.edu . Проверено 4 сентября 2023 г.
  9. ^ Рассел, Стюарт (2019). «3». Совместимость с человеком: ИИ и проблема управления . Аллен Лейн.
  10. ^ де Ягер, С. (11 апреля 2023 г.). «Семантический шум в схеме Винограда, задача устранения неоднозначности местоимений» . Гуманитарные и социальные науки. Коммуникации . 10 (1): 1–1 дои : 10.1057/ s41599-023-01643-9 ISSN   2662-9992 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 0670ae19b207ec396389d67ef348c9e9__1709950500
URL1:https://arc.ask3.ru/arc/aa/06/e9/0670ae19b207ec396389d67ef348c9e9.html
Заголовок, (Title) документа по адресу, URL1:
Never-Ending Language Learning - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)