Jump to content

Премия Лебнера

Фотография Хью Лебнера

Премия Лебнера — это ежегодный конкурс в области искусственного интеллекта , в ходе которого присуждались компьютерные программы, которые судьи считали наиболее похожими на человека. Формат конкурса был стандартным тестом Тьюринга . В каждом раунде судья-человек одновременно вел текстовые беседы с компьютерной программой и человеком через компьютер. На основании ответов судья попытается определить, что есть что.

Конкурс был учрежден в 1990 году Хью Лебнером совместно с Кембриджским центром поведенческих исследований , Массачусетс , США . Начиная с 2014 года [1] оно было организовано AISB в Блетчли-парке . [2] Он также был связан с Университетом Флиндерс , Дартмутским колледжем , Музеем науки в Лондоне , Университетом Рединга и Ольстерским университетом , кампусом Маги , Дерри , британским городом культуры .В 2004 и 2005 годах он проходил в квартире Лебнера в Нью-Йорке . В области искусственного интеллекта премия Лебнера вызывает некоторые споры; Самый известный критик Марвин Мински назвал это рекламным ходом, который не помогает отрасли. [3]

Формат финального конкурса 2019 года изменился. Судейской коллегии не было. Вместо этого чат-боты оценивались публикой, и среди людей не должно было быть конкурентов. [4] Сообщается, что с 2020 года премия прекратила свое существование. [5]

Первоначально за самую человечную программу конкурса была присуждена 2000 долларов. Приз составил 3000 долларов в 2005 году и 2250 долларов в 2006 году. В 2008 году было присуждено 3000 долларов.

Кроме того, были вручены две разовые премии, которые так и не были вручены. 25 000 долларов предлагается за первую программу, которую судьи не смогут отличить от настоящего человека и которая сможет убедить судей в том, что человек — это компьютерная программа. 100 000 долларов — это награда за первую программу, которую судьи не смогут отличить от настоящего человека в тесте Тьюринга, включающем расшифровку и понимание текстовых, визуальных и слуховых данных. Конкурс планировалось завершить после достижения этого приза.

Правила и ограничения соревнований

[ редактировать ]

Правила менялись с годами, и первые соревнования включали тесты Тьюринга с ограниченным разговором. [6] но с 1995 года обсуждение не было ограничено.

В трёх работах 2007 года: Роберт Медексза, Ной Дункан и Ролло Карпентер . [7] Спонсор использовал некоторые основные «проверочные вопросы» для оценки состояния технологии. В их число входили простые вопросы о времени, о том, какой сейчас тур конкурса и т. д.; общие знания («Для чего нужен молоток?»); сравнения («Что быстрее, поезд или самолет?»); и вопросы, демонстрирующие запоминание предыдущих частей одного и того же разговора. «Все существительные, прилагательные и глаголы взяты из словаря, подходящего для детей и подростков в возрасте до 12 лет». Для того чтобы заявки были приняты, не обязательно было «разумно» отвечать на вопросы.

Впервые в 2008 году спонсор разрешил ввести предварительный этап конкурса, открыв конкурс для ранее запрещенных заявок через Интернет, которые будут оцениваться различными приглашенными исследователями. В имеющихся правилах не указано, как отбираются и инструктируются следователи. У следователей (судящих системы) время ограничено: 5 минут на одного субъекта в соревнованиях 2003 г., 20+ на пару в соревнованиях 2004–2007 гг., 5 минут на ведение одновременных разговоров с человеком и программой в 2008–2009 гг. увеличено до 25. минут одновременного разговора с 2010 года.

Премия уже давно пренебрегается экспертами в этой области. [8] по целому ряду причин.

Многие считают это пиар-ходом. [9] [10] Марвин Мински язвительно предложил «приз» тому, кто сможет остановить соревнование. В ответ Лёбнер в шутку заметил, что предложение Минского приза за прекращение конкурса фактически сделало его соавтором. [11]

Правила соревнований поощряют неквалифицированных судей выносить поспешные решения. Взаимодействие между судьями и участниками изначально было очень кратким, например, фактически допрос длился 2,5 минуты, что позволяло задать лишь несколько вопросов. [9] Первоначально допрос ограничивался одной темой по выбору участника, например «причудливый разговор». [8] [12] домен, подходящий для стандартных трюков чат-бота. [13]

Участники конкурса не стремятся к пониманию или интеллекту, а прибегают к базовым приемам стиля ELIZA , [9] [14] и успешные участники обнаруживают, что обман и притворство вознаграждаются. [15]

Конкурсы

[ редактировать ]

В 2006 году конкурс организовали Тим Чайлд (генеральный директор Televirtual) и Хума Шах. [16] [17] 30 августа были объявлены четыре финалиста:

  • Ролло Карпентер
  • Ричард Черчилль и Мари-Клэр Дженкинс
  • Ной Дункан
  • Роберт Медексза

Конкурс прошел 17 сентября в VR-театре кампуса Торрингтон-Плейс Университетского колледжа Лондона . Университета Рединга кибернетики В состав судей вошли профессор Кевин Уорвик , профессор искусственного интеллекта Джон Барнден (специалист по исследованиям метафор в Университете Бирмингема ), адвокат Виктория Батлер-Коул и журналист Грэм Дункан-Роу. С впечатлениями последнего о мероприятии можно ознакомиться в статье в Technology Review . [18] [19] Победителем стала «Джоан», основанная на Джабберваки , созданных Ролло Карпентером.

Конкурс 2007 года прошел 21 октября в Нью-Йорке. Судьями были: профессор информатики Расс Эбботт, профессор философии Хартри Филд , доцент психологии Клейтон Кертис и преподаватель английского языка Скотт Хатчинс . [20]

Ни один бот не прошел тест Тьюринга, но судьи оценили трех участников следующим образом:

  • 1-е место: Роберт Медексза, создатель Ultra Hal
  • 2-е место: Ной Дункан, частная запись, создатель Клетуса.
  • 3-е место: Ролло Карпентер из Icogno, создатель Jabberwacky.

Победитель получил 2250 долларов и ежегодную медаль. Участники, занявшие второе место, получили по 250 долларов каждый.

Конкурс 2008 года был организован профессором Кевином Уорвиком при координации Хумы Шаха и прошел 12 октября в Университете Рединга, Великобритания . [21] После тестирования более ста судей на предварительном этапе в июне и июле 2008 года шесть финалистов были выбраны из тринадцати первоначальных искусственных разговорных объектов (ACE). В финале соревновались пятеро из приглашенных:

В финале каждому судье было дано пять минут на то, чтобы вести одновременный разговор на разделенном экране с двумя скрытыми существами. Элбот [22] искусственных решений [23] выиграл бронзовую награду премии Лебнера 2008 года за самое человекоподобное искусственное разговорное существо, обманув троих из двенадцати судей, допрашивавших его (в ходе параллельных сравнений между людьми), заставив их поверить, что это человек. Это очень близко к 30%, которые традиционно требуются для того, чтобы считать, что программа действительно прошла тест Тьюринга. Юджин Густман [24] и Ультра Хэл [25] оба обманули одного судью, что это был человек.

Уилл Павиа, журналист The Times , написал о своем опыте; Судья финала Лебнера, его обманули Элбот и Юджин. [26] Кевин Уорвик и Хума Шах сообщили о параллельных парных тестах Тьюринга. [27]

Конкурс на премию Лебнера 2009 года проводился 6 сентября 2009 года в Брайтон-центре , Брайтон, Великобритания, одновременно с конференцией Interspeech 2009. Сумма приза в 2009 году составила 3000 долларов США.

Участниками были Дэвид Леви , Ролло Карпентер и Мохан Эмбар, которые финишировали именно в таком порядке.

Писатель Брайан Кристиан участвовал в конкурсе на премию Лебнера 2009 года в качестве сообщника-человека и описал свой опыт участия в конкурсе в своей книге «Самый человечный человек» .

Конкурс на премию Лебнера 2010 года состоялся 23 октября в Калифорнийском государственном университете в Лос-Анджелесе. Конкурс 2010 года стал 20-м по счету. Победителем стал Брюс Уилкокс с Сюзетт.

Конкурс на премию Лебнера 2011 года состоялся 19 октября в Эксетерском университете , Девон , Великобритания. Сумма приза в 2011 году составила 4000 долларов США.

Четырьмя финалистами и их чат-ботами стали Брюс Уилкокс (Розетта), Адина Миньогна (Зои), Мохан Эмбар (Чип Вивант) и Рон Ли (Репетитор), которые финишировали именно в таком порядке.

В том же году в состав жюри вошли молодые судьи, а именно Джорджия-Мэй Линдфилд, Уильям Данн, Сэм Кит и Кирилл Джердев. Результаты юниорского конкурса заметно отличались от основного: первое место разделили чат-боты Tutor и Zoe, а третье и четвертое места соответственно заняли Chip Vivant и Rosette.

Конкурс на премию Лебнера 2012 года проводился 15 мая в Блетчли-парке в Блетчли , Бакингемшир , Англия, в честь празднования столетия Алана Тьюринга . Сумма приза в 2012 году составила 5000 долларов США. Организатором местных аранжировок был Дэвид Леви, лауреат премии Лебнера в 1997 и 2009 годах.

Четырьмя финалистами и их чат-ботами стали Мохан Эмбар (Чип Вивант), Брюс Уилкокс (Анжела), Дэниел Берк (Адам), М. Аллан (Лингуо), которые финишировали именно в таком порядке.

В том же году команда факультета компьютерных наук Эксетерского университета (Эд Кидвелл, Макс Дюпенуа и Кент МакКлимонт) провела первую в истории прямую интернет-трансляцию бесед. [28]

Конкурс на премию Лебнера 2013 года проводился, единственный раз на острове Ирландия , 14 сентября в Ольстерском университете , колледже Маги , Дерри , Северная Ирландия , Великобритания.

Четырьмя финалистами и их чат-ботами стали Стив Уорсвик (Мицуку), доктор Рон С. Ли (репетитор), Брюс Уилкокс (Роуз) и Брайан Ригсби (Изар), которые финишировали именно в таком порядке.

Судьями были профессор Роджер Шанк (сократическое искусство), профессор Ноэль Шарки ( Шеффилдский университет ), профессор Минхуа (Юнис) Ма ( Университет Хаддерсфилда , затем Университет Глазго ).и профессор Майк Мактир ( Университет Ольстера ).

На конкурсе Junior Loebner Prize 2013 чат-боты Мицуку и Тьютор разделили первое место, а Роуз и Изар заняли 3-е и 4-е места соответственно.

Конкурс на премию Лебнера 2014 года проходил в Блетчли-парке, Англия, в субботу, 15 ноября 2014 года. Мероприятие снималось в прямом эфире Sky News. Приглашенным судьей стал телеведущий и телеведущий Джеймс Мэй.

После двухчасового судейства победителем была признана «Роза» Брюса Уилкокса. Брюс получит чек на 4000 долларов и бронзовую медаль. Ранги были следующими:

Роуз — 1 место (4000 долларов и бронзовая медаль); Изар - Ранг 2,25 (1500$); Убербот — Ранг 3,25 (1000$); и Мицуку — ранг 3,5 (500 долларов).

Судьями были доктор Ян Хокинг, писатель и старший преподаватель психологии Колледжа Крайст-Черч, Кентербери; д-р Гита Куадри-Мостефауи, преподаватель компьютерных наук и технологий Бедфордширского университета; г-н Джеймс Мэй, телеведущий и телеведущий; и Доктор Пол Сант, декан UCMK Бедфордширского университета.

Конкурс на премию Лебнера 2015 года снова выиграла «Роза» Брюса Уилкокса. [29]

Судьями были Джейкоб Аарон, репортер журнала New Scientist по физике; Рори Селлан-Джонс, корреспондент BBC по технологиям; Бретт Марти, кинорежиссер и фотограф; Ариадна Тампион, писательница.

Премия Лебнера 2016 года прошла в Блетчли-парке 17 сентября 2016 года. После двух часов судейства были объявлены окончательные результаты. Ранги были следующими:

Премия Лёбнера 2017 года была проведена в Блетчли-парке 16 сентября 2017 года. Это был первый конкурс, в котором использовалось новое сообщение по протоколу сообщения, а не традиционное по одному символу за раз.Ранги были следующими и были объявлены Nao_(роботом) :

  • 1 место: Мицуку [30]
  • 2 место: Мидж
  • 3 место: Убербот
  • 4 место: Роза

Премия Лебнера 2018 года проводилась в Блетчли-парке 8 сентября 2018 года. Это был последний раз, когда она проводилась в традиционном формате теста Тьюринга, и последний раз в Блетчли-парке.Ранги были следующими:

  • 1 место: Мицуку [30]
  • 2 место: Репетитор
  • 3 место: Коломбина
  • 4 место: Убербот

Премия Лебнера 2019 года проходила в Университете Суонси с 12 по 15 сентября в рамках более крупной выставки, посвященной творчеству компьютеров. Формат конкурса изменился с традиционного теста Тьюринга с избранными судьями и людьми на четырехдневную сессию тестирования, где представители широкой публики, включая школьников, могли взаимодействовать с ботами, заранее зная, что боты не люди. . Вместо обычных 4-х финалистов приняли участие семнадцать ботов. Стив Уорсвик в рекордный 5-й раз одержал победу вместе с Мицуку, что позволило ему попасть в Книгу рекордов Гиннеса. [31]

Избранное жюри из судей также рассмотрело и проголосовало за те, которые им понравились больше всего.Ранги были следующими:

Самый человекоподобный чат-бот:

  • 1 место: Мицуку [30] - 24 балла
  • 2 место: Убербот – 6 очков
  • 3 место: Анна – 5 очков

Лучший чат-бот в целом

  • 1 место: Мицуку [30] - 19 очков
  • 2 место: Убербот – 5 баллов
  • 3 место: Арккон – 4 очка

Победители

[ редактировать ]

Официальный список победителей. [32]

Год Победитель Программа
1991 Джозеф Вайнтрауб «Причудливый разговор» [33] ( ПК-терапевт ) [34]
1992 Джозеф Вайнтрауб ПК-терапевт
1993 Джозеф Вайнтрауб ПК-терапевт
1994 Томас Уэлен СОВЕТЫ
1995 Джозеф Вайнтрауб ПК-терапевт
1996 Джейсон Хатченс HeX
1997 Дэвид Леви Конверсы
1998 Робби Гарнер Альберт Один
1999 Робби Гарнер Альберт Один
2000 Ричард Уоллес Искусственный лингвистический Интернет-компьютерный объект (ALICE)
2001 Ричард Уоллес Искусственный лингвистический Интернет-компьютерный объект (ALICE)
2002 Кевин Коппл Она
2003 Юрген Пирнер Бармаглот
2004 Ричард Уоллес Искусственный лингвистический Интернет-компьютерный объект (ALICE)
2005 Ролло Карпентер Джордж (Джабберваки)
2006 Ролло Карпентер Джоан (Джабберваки)
2007 Роберт Медексза Ультра Хэл
2008 Фред Робертс Элбот
2009 Дэвид Леви Делай гораздо больше
2010 Брюс Уилкокс Сюзетта
2011 Брюс Уилкокс Розетка [35]
2012 Мохан Эмбар Чип жив [36]
2013 Стив Уорсвик Мицуку [30]
2014 Брюс Уилкокс Роза
2015 Брюс Уилкокс Роза
2016 Стив Уорсвик Мицуку [30]
2017 Стив Уорсвик Мицуку [30]
2018 Стив Уорсвик Мицуку [30]
2019 Стив Уорсвик Мицуку [30]

См. также

[ редактировать ]
  1. Премия Лебнера, соревнование по тесту Тьюринга в Блетчли-парке — блог Эксетера , дата обращения 8 декабря 2014 г.
  2. ^ Премия Лебнера , веб-сайт AISB , дата обращения 23 января 2018 г.
  3. Искусственная глупость , Salon.com , 16 февраля 2003 г.
  4. ^ Уэйкфилд, Джейн (14 сентября 2019 г.). «Любители, увлеченные своим хобби, соревнуются за то, чтобы сделать ИИ человеком» . Новости Би-би-си . Проверено 23 июля 2020 г.
  5. ^ Уэйкфилд, Джейн (1 ноября 2020 г.). «Роботы-зануды: неловкое первое свидание с помощью искусственного интеллекта» . Новости Би-би-си . Проверено 22 сентября 2021 г.
  6. ^ « Машины, которые думают», 4 сезон, 3 серия . Научные американские границы . Производственная компания Чедд-Анжер. 1993–1994 гг. ПБС . Архивировано из оригинала 1 января 2006 г.
  7. 17-я ежегодная премия Лебнера в области искусственного интеллекта, 21 октября 2007 г., Нью-Йорк.
  8. ^ Jump up to: а б Пауэрс, Дэвид (1998). «Полный тест Тьюринга и премия Лебнера» . Проверено 29 мая 2016 г. .
  9. ^ Jump up to: а б с Флориди, Лучано; Таддео, Мариаросария; Турилли, Маттео (2009). «Имитационная игра Тьюринга: все еще невыполнимая задача для всех машин и некоторых судей - оценка конкурса Лёбнера 2008 года». Разум и машины . 19 (19): 145–150. CiteSeerX   10.1.1.672.7417 . дои : 10.1007/s11023-008-9130-6 . S2CID   7888490 .
  10. ^ Сундман, Джон (27 февраля 2003 г.). «Искусственная глупость» . Салон . Архивировано из оригинала 20 июля 2012 г. Проверено 29 мая 2016 г. .
  11. ^ Мински, Марвин. «Объявление об отзыве премии Мински Лебнера за 1995 год» . Проверено 29 мая 2016 г. .
  12. ^ Шибер, Стюарт М. (1993). «Уроки ограниченного теста Тьюринга» . Проверено 2 апреля 2024 г.
  13. ^ Фишер, Ричард (16 мая 2012 г.). «Чат-ботам не удается убедить, несмотря на получение премии Лебнера» . Новый учёный . Проверено 29 мая 2016 г. .
  14. ^ Серк, ЗЛинда. «Может ли компьютер думать?» . Би-би-си . Проверено 29 мая 2016 г. .
  15. ^ Стивенс, Кеннет Р. «Что конкурс Лебнера рассказал нам о коммуникативных системах?» (PDF) . www.behavior.org . Оперантные веб-сайты, Inc. Проверено 29 мая 2016 г. .
  16. ^ Информация о премии Лебнера 2006 г.
  17. ^ Лобнер 2006
  18. ^ Как быть человеком , Обзор технологий , 20 сентября 2006 г.
  19. ^ Премия Лебнера , loebner.net
  20. ^ 17-я ежегодная премия Лебнера в области искусственного интеллекта , loebner.net
  21. 18-я ежегодная премия Лебнера в области искусственного интеллекта, 12 октября 2008 г., Университет Рединга, Ридинг, Великобритания.
  22. ^ «Робот Элбот» . www.elbot.com . Архивировано из оригинала 4 января 2015 г. Проверено 12 февраля 2023 г.
  23. ^ Искусственные решения
  24. ^ «Евгений Густман» . Архивировано из оригинала 17 июня 2017 г. Проверено 21 октября 2008 г.
  25. ^ Ультра Хэл
  26. ^ Машина сражается с человеком на массовом тесте Тьюринга
  27. ^ параллельно-парные тесты Тьюринга
  28. ^ «Интернет-трансляция премии Лебнера 2012» . Архивировано из оригинала 18 мая 2012 года . Проверено 15 мая 2012 г.
  29. ^ «Чат-бот Роуз выиграл премию Лёбнера в области искусственного интеллекта в 2015 году» . Новости Би-би-си . Проверено 29 мая 2016 г. .
  30. ^ Jump up to: а б с д и ж г час я дж «Чат-бот Мицуку» .
  31. ^ https://www.guinnessworldrecords.com/world-records/603076-most-loebner-prize-wins
  32. ^ Лауреаты премии Лебнера , AISB — Общество изучения искусственного интеллекта и моделирования поведения.
  33. ^ « Машины, которые думают», 2 сезон, 5 серия . Научные американские границы . Производственная компания Чедд-Анжер. 1991–1992 гг. ПБС . Архивировано из оригинала 1 января 2006 г.
  34. ^ «Лёбнер» . 5 апреля 2017 г.
  35. ^ «Читайте о розетке, получившей премию Лебнера, — чат-боте Брюса Уилкокса» . Архивировано из оригинала 15 мая 2013 года . Проверено 29 октября 2011 г.
  36. ^ «Чип Вивант — Мохан Эмбар» .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 233491cf6489fd84220a5edb6d0c8bd8__1721748960
URL1:https://arc.ask3.ru/arc/aa/23/d8/233491cf6489fd84220a5edb6d0c8bd8.html
Заголовок, (Title) документа по адресу, URL1:
Loebner Prize - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)