Jump to content

Теорема о гадком утенке

Теорема о гадком утенке – это аргумент, показывающий, что классификация на самом деле невозможна без некоторой предвзятости . Точнее, он предполагает конечное число свойств, комбинируемых логическими связками , и конечное число объектов; он утверждает, что любые два разных объекта имеют одинаковое количество ( экстенсиональных ) свойств. Теорема названа в честь рассказа Ганса Христиана Андерсена 1843 года « Гадкий утенок », поскольку она показывает, что утенок так же похож на лебедя , как два лебедя друг на друга. Он был выведен Сатоси Ватанабэ в 1969 году. [1] : 376–377 

Математическая формула

[ редактировать ]
Пример Ватанабе с использованием объектов A , B , C и свойств F («первый»), W («белый»). «0», «1», « ¬ », « », « » и « » обозначают « ложь », « истина », « не », « и », « или » и « исключительный или ». , соответственно. Поскольку F подразумевает W, каждый предикат, который может быть образован из F и W, совпадает с другим, следовательно, существует только 8 экстенсионально различных возможных предикатов, каждый из которых показан на отдельной строке. Белые утята A и B согласны относительно 4 из них (строки 2, 3, 4, 8), но также согласны A и C (строки 3, 5, 7, 8), а также B и C (строка 1). , 3, 6, 8). [1] : 368  [2]

существует n Предположим , во вселенной вещей, и кто-то хочет разделить их на классы или категории. У человека нет предвзятых представлений или предубеждений относительно того, какие категории являются «естественными» или «нормальными», а какие нет. Поэтому нужно рассмотреть все возможные классы, все возможные способы создания набора из n объектов. Есть Таким образом, размер набора мощности из n объектов. Это можно использовать для измерения сходства между двумя объектами и увидеть, сколько у них общих наборов. Однако нельзя. Любые два объекта имеют одинаковое количество общих классов, если мы можем образовать любой возможный класс, а именно (половина общего количества классов). Чтобы убедиться в этом, можно представить, что каждый класс представлен n- битной строкой (или целым двоичным кодом ) с нулем для каждого элемента, не входящего в класс, и единицей для каждого элемента в классе. Как выяснилось, существуют такие струны.

Поскольку имеются все возможные варианты выбора нулей и единиц, любые две битовые позиции будут совпадать ровно в половине случаев. Можно выбрать два элемента и переупорядочить биты так, чтобы они стали первыми двумя, и представить себе числа, отсортированные лексикографически. Первый в числах бит №1 будет установлен в ноль, а второй будет установлен на единицу. Внутри каждого из этих блоков верхняя часть бит №2 будет установлен в ноль, а другой будет иметь его как один, поэтому они соглашаются на два блока или в половине всех случаев, независимо от того, какие два элемента выбрать. Таким образом, если у нас нет предвзятого мнения относительно того, какие категории лучше, тогда все будет одинаково похоже (или одинаково несходно). Число предикатов, одновременно удовлетворяемых двумя неидентичными элементами, постоянно во всех таких парах. Таким образом, какая-то индуктивная [ нужна ссылка ] предвзятость необходима для вынесения суждений в пользу предпочтения определенных категорий другим.

Булевы функции

[ редактировать ]

Позволять быть набором векторов логические значения каждый. Гадкий утенок — вектор, наименее похожий на остальных. Учитывая логические значения, это можно вычислить, используя расстояние Хэмминга .

Однако выбор рассматриваемых логических функций мог быть несколько произвольным. Возможно, существовали признаки, вытекающие из исходных признаков, которые были важны для идентификации гадкого утенка. Набор логических значений в векторе можно расширить за счет новых функций, вычисляемых как логические функции вектора. оригинальные особенности. Единственный канонический способ сделать это — расширить его всеми возможными логическими функциями. Полученные в результате завершенные векторы имеют функции. Теорема о гадком утенке утверждает, что гадкого утенка не существует, поскольку любые два завершенных вектора будут либо равны, либо различаться ровно по половине признаков.

Доказательство. Пусть x и y — два вектора. Если они одинаковы, то их завершенные векторы также должны быть одинаковыми, поскольку любая булева функция от x будет согласовываться с той же булевой функцией от y. Если x и y различны, то существует координата где -я координата отличается от -я координата . Теперь завершенные функции содержат все логические функции на Логические переменные, каждая из которых ровно один раз. Рассматривая эти логические функции как полиномы в переменные над GF(2), разделите функции на пары где содержит -я координата как линейный член и является без этого линейного члена. Теперь для каждой такой пары , и согласятся ровно на одну из двух функций. Если они согласны в одном, они должны не соглашаться и в другом, и наоборот. (Считается, что это доказательство принадлежит Ватанабэ.)

Обсуждение

[ редактировать ]

Возможным способом обойти теорему о гадком утенке было бы введение ограничения на то, как измеряется сходство, путем ограничения свойств, участвующих в классификации, например, между A и B. Однако Medin et al. (1993) отмечают, что это на самом деле не решает проблему произвольности или предвзятости, поскольку в каких отношениях А похоже на Б: «меняется в зависимости от контекста стимула и задачи, так что не существует однозначного ответа на вопрос, насколько сходны один объект к другому». [3] [5] Например, «шестёрка и зебра были бы более похожими, чем лошадь и зебра, если бы полосатый признак имел достаточный вес. Конечно, если бы веса этих признаков были фиксированными, то отношения сходства были бы ограничены». Тем не менее, свойство «полосатое» как «фиксация» или ограничение веса само по себе является произвольным, а это означает: «если нельзя указать такие критерии, то утверждение о том, что категоризация основана на сопоставлении атрибутов, почти полностью бессмысленно».

Стамос (2003) заметил, что некоторые суждения об общем сходстве не произвольны в том смысле, что они полезны:

«Предположительно, перцептивные и концептуальные процессы людей развились так, что информация, которая имеет значение для человеческих потребностей и целей, может быть грубо аппроксимирована эвристикой сходства... Если вы находитесь в джунглях и видите тигра, но решаете не стереотипизировать (возможно, потому что вы верите, что сходство — ложный друг), то вас, вероятно, съедят. Другими словами, в биологическом мире стереотипы, основанные на достоверных суждениях об общем сходстве, статистически приводят к большей выживаемости и репродуктивному успеху». [6]

Если только некоторые свойства не будут считаться более заметными или «приданными» более важными, чем другие, все будет казаться одинаково похожим, поэтому Ватанабэ (1986) писал: «Любые объекты, насколько они различимы, одинаково похожи». [7]

В более слабой ситуации, которая предполагает бесконечное множество свойств, Мерфи и Медин (1985) приводят пример двух предполагаемых классифицированных вещей: слив и газонокосилок:

«Предположим, что нужно перечислить общие черты сливы и газонокосилки, чтобы судить об их сходстве. Легко видеть, что список может быть бесконечным: обе весят менее 10 000 кг (и менее 10 001 кг), обе не существовало 10 000 000 лет назад (и 10 000 001 год назад), оба плохо слышат, оба можно уронить, оба занимают место и так далее. Точно так же список различий может быть бесконечным… любые две сущности могут быть сколь угодно похожими или. несходства путем изменения критерия того, что считается релевантным атрибутом». [8]

По словам Вудворда, [9] Теорема о гадком утенке связана с законом сохранения эффективности обобщения Шаффера , который гласит, что все алгоритмы обучения логических функций на примерах ввода/вывода имеют такую ​​же общую производительность обобщения, что и случайное угадывание. [10] Последний результат Вудворд обобщает на функции в счетных бесконечных областях. [11]

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Перейти обратно: а б Сатоси Ватанабэ (1969). Знание и догадка: количественное исследование выводов и информации . Нью-Йорк: Уайли. ISBN  0-471-92130-0 . LCCN   68-56165 .
  2. ^ Ватанабэ x 1 , x 2 , x 3 , y 1 и y 2 соответствуют C , B , A , F и W соответственно.
  3. ^ Дуглас Л. Медин, Р. Л. Голдстоун и Дедре Гентнер (1993). «Уважение к сходству». Психологический обзор . 100 (2): 254–278. дои : 10.1037/0033-295x.100.2.254 .
  4. ^ Нельсон Гудман (1972). «Семь ограничений сходства». В Нельсоне Гудмане (ред.). Проблемы и проекты . Нью-Йорк: Боббс-Меррилл. стр. 437–446.
  5. ^ Философ Нельсон Гудман [4] пришел к тому же выводу: «Но важность - это очень изменчивый вопрос, меняющийся в зависимости от каждого изменения контекста и интересов и совершенно неспособный поддерживать фиксированные различия, на которых философы так часто стремятся опираться».
  6. ^ Стамос, Д.Н. (2003). Проблема видов . Лексингтонские книги. п. 344.
  7. ^ Сатоси Ватанабэ (1986). «Эпистемологическая относительность» . Анналы Японской ассоциации философии науки . 7 (1): 1–14. дои : 10.4288/jafpos1956.7.1 .
  8. ^ Грегори Л. Мерфи и Дуглас Л. Медин (июль 1985 г.). «Роль теорий в концептуальной последовательности» (PDF) . Психологический обзор . 92 (3): 289–316. дои : 10.1037/0033-295x.92.3.289 . ПМИД   4023146 .
  9. ^ Джон Р. Вудворд (ноябрь 2009 г.). «Вычислимые и невычислимые функции и алгоритмы поиска» (PDF) . Международная конференция по интеллектуальным вычислениям и интеллектуальным системам . IEEE. стр. 871–875. дои : 10.1109/ICICISYS.2009.5358045 . ISBN  978-1-4244-4754-1 . S2CID   14473304 . Здесь: с. 874 лф
  10. ^ Каллен Шаффер (1994). «Закон сохранения эффективности обобщения» (PDF) . В Виллиане, Х.; Коэн, В. (ред.). Материалы Международной конференции по машинному обучению 1994 г. (Сан-Матео, Калифорния) . Морган Кауфманн. стр. 259–265. Здесь п. 260 футов
  11. ^ Вудворд (2009), с. 875 лф
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: a38918f273580ec0c79cb3f900b2e972__1715110860
URL1:https://arc.ask3.ru/arc/aa/a3/72/a38918f273580ec0c79cb3f900b2e972.html
Заголовок, (Title) документа по адресу, URL1:
Ugly duckling theorem - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)