Оригинальное доказательство теоремы Гёделя о полноте

Доказательство теоремы Гёделя о полноте, данное Куртом Гёделем в его докторской диссертации 1929 года (и более короткая версия доказательства, опубликованная в 1930 году в виде статьи под названием «Полнота аксиом функционального логического исчисления» (на немецком языке) ) сегодня нелегко читать; он использует концепции и формализмы, которые больше не используются, а также терминологию, которая часто неясна. В приведенной ниже версии делается попытка достоверно отобразить все этапы доказательства и все важные идеи, переформулировав доказательство на современном языке математической логики . Этот план не следует рассматривать как строгое доказательство теоремы.
Предположения
[ редактировать ]Мы работаем с исчислением предикатов первого порядка . Наши языки допускают символы констант, функций и отношений. Структуры состоят из (непустых) областей и интерпретаций соответствующих символов как постоянных членов, функций или отношений в этой области.
Мы предполагаем классическую логику (в отличие, например, от интуиционистской логики).
Мы фиксируем некоторую аксиоматизацию (т. е. основанную на синтаксисе, управляемую машиной систему доказательства) исчисления предикатов: логические аксиомы и правила вывода. Подойдет любая из нескольких хорошо известных эквивалентных аксиоматизаций. Первоначальное доказательство Гёделя предполагало систему доказательств Гильберта-Акермана .
Мы предполагаем без доказательства все основные известные результаты о нашем формализме, которые нам нужны, такие как теорема о нормальной форме или теорема о корректности .
Мы аксиоматизируем исчисление предикатов без равенства (иногда его ошибочно называют без тождества ), т. е. не существует специальных аксиом, выражающих свойства (объектного) равенства в виде специального символа отношения. После того как основная форма теоремы будет доказана, ее нетрудно распространить на случай исчисления предикатов с равенством .
Формулировка теоремы и ее доказательство
[ редактировать ]Ниже мы сформулируем две эквивалентные формы теоремы и покажем их эквивалентность.
Позже мы докажем теорему. Это делается следующими шагами:
- Сведение теоремы к предложениям (формулам без свободных переменных) в пренексной форме , т.е. со всеми кванторами ( ∀ и ∃ ) в начале. Более того, мы сводим его к формулам, первый квантор которых равен ∀ . Это возможно, потому что для каждого предложения существует эквивалентное в пренексной форме, первый квантор которого равен ∀ .
- Сведение теоремы к предложениям вида ∀ x 1 ∀ x 2 ... ∀ x k ∃ y 1 ∃ y 2 ... ∃ y m φ ( x 1 ... x k , y 1 ... y m ) . Хотя мы не можем сделать это, просто переставляя кванторы, мы показываем, что этого еще достаточно, чтобы доказать теорему для предложений такой формы.
- Наконец, мы докажем теорему для предложений такой формы.
- Для этого сначала отметим, что такое предложение, как B = ∀ x 1 ∀ x 2 ...∀ x k ∃ y 1 ∃ y 2 ...∃ y m φ( x 1 ... x k , y 1 . .. y m ) либо опровержимо (его отрицание всегда истинно), либо выполнимо, т. е. существует некоторая модель, в которой оно выполняется (оно может даже быть всегда истинным, т.е. тавтология); эта модель просто присваивает истинностные значения подпредложениям, из которых построено B. Причиной этого является полнота пропозициональной логики , в которой кванторы существования не играют никакой роли.
- Мы распространим этот результат на все более и более сложные и длинные предложения D n ( n = 1,2...), построенные из B , так что либо любое из них опровержимо, а значит, и φ , либо все они опровержимы. не является опровержимым и, следовательно, каждое из них справедливо в некоторой модели.
- Наконец, мы используем модели, в которых выполняются D n (в случае, если все они неопровержимы), чтобы построить модель, в которой выполняется φ .
Теорема 1. Любая допустимая формула (истинная во всех структурах) доказуема.
[ редактировать ]Это самая основная форма теоремы о полноте. Сразу переформулируем это в более удобной для наших целей форме: Когда мы говорим «все структуры», важно указать, что рассматриваемые структуры представляют собой классические (тарские) интерпретации I, где I = <U,F> (U — непустое (возможно, бесконечное) множество объектов, тогда как F представляет собой набор функций из выражений интерпретируемой символики в U). [Напротив, так называемые «свободные логики» допускают, возможно, пустые множества для U. Дополнительную информацию о свободной логике см. в работе Карела Ламберта.]
Теорема 2. Любая формула φ либо опровержима, либо выполнима в некоторой структуре.
[ редактировать ]« φ опровержимо» означает по определению « ¬φ доказуемо».
Эквивалентность обеих теорем
[ редактировать ]Если теорема 1 верна и φ не выполнима ни в одной структуре, то ¬φ действительна во всех структурах и, следовательно, доказуема, таким образом, φ опровержима и теорема 2 верна. Если, с другой стороны, теорема 2 верна и φ справедлива во всех структурах, то ¬φ невыполнима ни в одной структуре и, следовательно, опровержима; тогда ¬¬φ доказуемо, а затем и φ, поэтому теорема 1 верна.
Доказательство теоремы 2: первый шаг
[ редактировать ]Мы подходим к доказательству теоремы 2, последовательно ограничивая класс всех формул φ, для которых нам нужно доказать, что «φ либо опровержима, либо выполнима». Вначале нам нужно доказать это для всех возможных формул φ в нашем языке. Однако предположим, что для каждой формулы φ существует некоторая формула ψ, взятая из более ограниченного класса формул C , такая, что «ψ либо опровержимо, либо выполнимо» → «φ либо опровержимо, либо выполнимо». Тогда, как только это утверждение (выраженное в предыдущем предложении) будет доказано, будет достаточно доказать, что «φ либо опровержима, либо выполнима» только для принадлежности φ классу C . Если φ доказуемо эквивалентно ψ ( т. е . ( φ ≡ ψ ) доказуемо), то это действительно тот случай, когда «ψ либо опровержимо, либо выполнимо» → « φ либо опровержимо, либо выполнимо» ( теорема о корректности необходима для того, чтобы покажи это).
Существуют стандартные методы переписывания произвольной формулы в формулу, не использующую функции или постоянные символы, за счет введения дополнительных кванторов; поэтому мы будем считать, что все формулы свободны от таких символов. В статье Гёделя используется версия исчисления предикатов первого порядка, которая изначально не имеет функций или постоянных символов.
Далее мы рассматриваем общую формулу φ (которая больше не использует функциональные или постоянные символы) и применяем теорему о предварительной форме , чтобы найти формулу ψ в нормальной форме такую, что φ ≡ ψ ( ψ нахождение в нормальной форме означает, что все кванторы в ψ , если они есть, то находятся в самом начале ψ ). Отсюда следует, что нам осталось доказать теорему 2 только для формул φ в нормальной форме.
Далее мы исключаем все свободные переменные из φ, определяя их экзистенциально: если, скажем, x 1 ... x n свободны в φ , мы образуем . Если ψ выполнима в структуре M , то, конечно, так же выполнима и ψ , и если ψ опровержима, то доказуемо, а значит, и ¬ φ , следовательно, φ опровержимо. что мы можем ограничить φ предложением Мы видим , , то есть формулой без свободных переменных.
Наконец, нам хотелось бы, по соображениям технического удобства, чтобы префикс φ φ (то есть строка кванторов в начале , которая находится в нормальной форме) начинался с квантора всеобщности и заканчивался квантором существования. Чтобы добиться этого для общего φ (с учетом ограничений, которые мы уже доказали), мы берем некоторый одноместный символ отношения F, не используемый в φ , и две новые переменные y и z . Если φ = (P)Φ , где (P ) обозначает префикс φ и Φ для матрицы (оставшаяся, свободная от кванторов часть φ ), которую мы формируем . С ясно доказуемо, легко видеть, что доказуемо.
Сведение теоремы к формулам степени 1
[ редактировать ]Наша общая формула φ теперь представляет собой предложение в нормальной форме, и ее префикс начинается с квантора универсальности и заканчивается квантором существования. Назовем класс всех таких формул R . Нам предстоит доказать, что каждая формула из R либо опровержима, либо выполнима. Учитывая нашу формулу φ, мы группируем строки кванторов одного вида в блоки:
Мы степень определяем быть количеством блоков кванторов универсальности, разделенных блоками кванторов существования, как показано выше, в префиксе . Следующая лемма, которую Гёдель адаптировал из доказательства Скулема теоремы Левенгейма–Скулема , позволяет резко снизить сложность общей формулы нам нужно доказать теорему для:
Лемма . Пусть k ≥ 1. Если каждая формула из R степени k либо опровержима, либо выполнима, то то же самое можно сказать и о любой формуле из R степени k + 1.
- Комментарий : Возьмем формулу φ степени k + 1 вида , где это остаток (таким образом, он имеет степень k − 1). φ утверждает, что для каждого x существует такой, что... (что-то). Было бы неплохо иметь предикат Q', чтобы для каждого x Q '( x , y ) был истинным тогда и только тогда, когда y является необходимым для того, чтобы сделать (что-то) истинным. Тогда мы могли бы написать формулу степени k , эквивалентную φ, а именно . Эта формула действительно эквивалентна φ, поскольку она утверждает, что для каждого x, если существует y, удовлетворяющее Q'(x,y), то (что-то) имеет место, и, более того, мы знаем, что существует такое y, потому что для каждого x ', существует y', который удовлетворяет условию Q'(x',y'). Поэтому φ следует из этой формулы. Также легко показать, что если формула неверна, то ложна и φ. К сожалению , такого предиката Q' вообще не существует. Однако эту идею можно понять как основу для следующего доказательства леммы.
Доказательство. Пусть φ — формула степени k + 1; тогда мы можем написать это как
где (P) — остаток префикса (таким образом, он имеет степень k – 1) и представляет собой бескванторную матрицу . x , y , u и v обозначают здесь кортежи переменных, а не отдельные переменные; например действительно означает где являются некоторыми отдельными переменными.
Пусть теперь x' и y' будут кортежами ранее неиспользованных переменных той же длины, что и x и y соответственно, и пусть Q будет ранее неиспользованным символом отношения, который принимает столько аргументов, сколько сумма длин x и y ; мы рассматриваем формулу
Четко, доказуемо.
Теперь, поскольку строка кванторов не содержит переменных из x или y , следующая эквивалентность легко доказывается с помощью любого используемого нами формализма:
А так как эти две формулы эквивалентны, то если заменить первую на вторую внутри Φ, мы получим формулу Φ' такую, что Φ≡Φ':
Теперь Ф' имеет вид , где (S) и (S') — некоторые строки-кванторы, ρ и ρ' не содержат кванторов, и, кроме того , ни одна переменная из (S) не встречается в ρ' и ни одна переменная из (S') не встречается в ρ. В таких условиях каждая формула вида , где (T) — строка кванторов, содержащая все кванторы в (S) и (S'), перемежающиеся между собой любым способом, но сохраняющие относительный порядок внутри (S) и (S'), будет эквивалентен исходному формула Ф' (это еще один основной результат исчисления предикатов первого порядка, на который мы опираемся). А именно, сформируем Ψ следующим образом:
и у нас есть .
Сейчас является формулой степени k и, следовательно, по предположению либо опровержима, либо выполнима. Если выполнима в структуре M , то, учитывая , мы видим это также является удовлетворительным. Если опровержимо, то и так , что эквивалентно ему; таким образом доказуемо. Теперь мы можем заменить все вхождения Q в доказуемую формулу по какой-то другой формуле, зависящей от тех же переменных, и мы все равно получим доказуемую формулу. ( Это еще один основной результат исчисления предикатов первого порядка. В зависимости от конкретного формализма, принятого для исчисления, его можно рассматривать как простое применение правила вывода «функциональной замены», как в статье Гёделя, или как быть доказана путем рассмотрения формального доказательства , заменив в нем все вхождения Q какой-либо другой формулой с теми же свободными переменными и отметив, что все логические аксиомы в формальном доказательстве остаются логическими аксиомами после замены, и все правила вывода по-прежнему применяются таким же образом. )
В данном конкретном случае мы заменяем Q(x',y') в с формулой . Здесь (x,y | x',y') означает, что вместо ψ мы пишем другую формулу, в которой x и y заменены на x' и y'. Q(x,y) просто заменяется на .
затем становится
и эта формула доказуема; поскольку отрицаемая часть и после знака очевидно доказуема, а отрицаемая часть и перед знак, очевидно, φ, просто заменив x и y на x' и y' , мы видим, что доказуемо, а φ опровержимо. Мы доказали, что ф либо выполнима, либо опровержима, и этим завершается доказательство леммы .
Обратите внимание, что мы не могли использовать вместо Q(x',y') с самого начала, потому что В этом случае формула не была бы корректной . Вот почему мы не можем наивно использовать аргумент, приведенный в комментарии, предшествующем доказательству.
Доказательство теоремы для формул степени 1
[ редактировать ]Как показывает лемма выше , нам нужно доказать нашу теорему только для формул φ из R степени 1. φ не может иметь степень 0, поскольку формулы в R не имеют свободных переменных и не используют константные символы. Таким образом, формула φ имеет общий вид:
Теперь мы определим порядок k - наборов натуральных чисел следующим образом: должно сохраняться, если либо , или , и предшествует в лексикографическом порядке . [Здесь обозначает сумму членов кортежа.] Обозначим n-й кортеж в этом порядке через .
Установите формулу как . Затем положите как
Лемма : Для n каждого .
Доказательство : индукцией по n ; у нас есть , где последнее импликация выполняется путем замены переменных, поскольку порядок кортежей таков, что . Но последняя формула эквивалентна ф.
Для базового случая очевидно, также является следствием φ. Итак, лемма доказана.
Теперь, если опровержимо для некоторого n , то из этого следует, что φ опровержима. С другой стороны, предположим, что неопровержимо ни для какого n . Тогда для каждого n существует некоторый способ присвоить истинностные значения различным подпредложениям. (упорядочены по их первому появлению в ; «различный» здесь означает либо отдельные предикаты, либо отдельные связанные переменные) в , такой, что будет истинным, если каждое предложение оценивать таким образом. Это следует из полноты лежащей в основе пропозициональной логики .
Теперь мы покажем, что существует такое присвоение истинностных значений , так что все будет правдой: появляются в одном и том же порядке во всех ; мы индуктивно определим общее присвоение им своего рода «большинством голосов»: поскольку существует бесконечно много присвоений (по одному на каждое ) влияет , либо бесконечно много делают истинным, или бесконечно многие делают его ложным, и только конечное число делают его истинным. В первом случае мы выбираем быть правдой в целом; в последнем случае мы считаем его вообще ложным. Тогда из бесконечного числа n, для которых через присваиваются то же истинностное значение, что и в общем присваивании, мы выбираем общее присвоение для таким же образом.
Это общее задание должно привести к каждому из и верно, поскольку если один из были ложными по общему заданию, также будет ложным для каждого n > k . Но это противоречит тому, что для конечного набора общих задания появляются в , существует бесконечно много n , где выполнение присваивания true соответствует общему назначению.
Из этого общего задания, которое делает все true, мы создаем интерпретацию предикатов языка, которая делает φ истинным. Вселенная модели будет состоять из натуральных чисел . Каждый i-арный предикат должно быть правдой для натуральных людей именно тогда, когда предложение либо истинно в общем присваивании, либо не задано им (поскольку оно никогда не появляется ни в одном из ).
В этой модели каждая из формул верно по построению. Но это означает, что φ сама по себе верна в модели, поскольку диапазон по всем возможным k-кортежам натуральных чисел. Итак, φ выполнимо, и мы закончили.
Интуитивное объяснение
[ редактировать ]Мы можем записать каждый B i как Φ( x 1 ... x k , y 1 ... y m ) для некоторых x s, которые мы можем назвать «первыми аргументами», и y s, которые мы можем назвать «последними аргументами».
Возьмем Б 1 , к примеру, . Его «последними аргументами» являются z 2 , z 3 ... z m +1 , и для каждой возможной комбинации k этих переменных существует некоторый j, так что они появляются как «первые аргументы» в B j . при достаточно большом n 1 Таким образом , D n 1 обладает свойством, заключающимся в том, что «последние аргументы» B 1 появляются во всех возможных комбинациях из k из них как «первые аргументы» в других B j s внутри D n . Для каждого B i существует D n i с соответствующим свойством.
Следовательно, в модели, которая удовлетворяет всем D n s, существуют объекты, соответствующие z 1 , z 2 ... и каждая комбинация k из них появляется как «первые аргументы» в некотором B j , что означает, что для каждого k из этих объекты z p 1 ... z p k существуют z q 1 ... z q m , что делает Φ( z p 1 ... z p k , z q 1 ... z q m ) удовлетворенным. Взяв подмодель только с этими объектами z 1 , z 2 ..., мы получим модель, удовлетворяющую φ .
Расширения
[ редактировать ]Расширение исчисления предикатов первого порядка с равенством
[ редактировать ]Гёдель сократил формулу, содержащую экземпляры предиката равенства, до формул без него в расширенном языке. Его метод заключается в замене формулы φ, содержащей некоторые случаи равенства, формулой
Здесь обозначаем предикаты, входящие в φ (при этом их соответствующие арности), а φ' — это формула φ, в которой все вхождения равенства заменены новым предикатом Eq . Если эта новая формула опровержима, то и первоначальная φ была опровержимой; то же самое относится и к выполнимости, поскольку мы можем взять фактор удовлетворения модели новой формулы по отношению эквивалентности, представляющему уравнение . Это частное четко определено по отношению к другим предикатам и, следовательно, будет удовлетворять исходной формуле φ.
Распространение на счетные множества формул.
[ редактировать ]Гёдель также рассмотрел случай, когда имеется счетный набор формул. Используя те же сокращения, что и выше, он смог рассмотреть только те случаи, когда каждая формула имеет степень 1 и не содержит использования равенства. Для счетного набора формул степени 1, мы можем определить как указано выше; затем определите быть закрытием . Остальная часть доказательства прошла так же, как и раньше.
Распространение на произвольные наборы формул
[ редактировать ]Когда существует несчетно бесконечный набор формул, Аксиома выбора необходима (или, по крайней мере, какая-то ее слабая форма). Используя полный AC, можно хорошо упорядочить формулы и доказать несчетный случай с тем же аргументом, что и счетный, за исключением трансфинитной индукции . Другие подходы можно использовать, чтобы доказать, что теорема о полноте в этом случае эквивалентна булевой теореме о простых идеалах , слабой форме AC.
Ссылки
[ редактировать ]- Гёдель, К. (1929). О полноте логического исчисления (Докторская диссертация). Венский университет. Первое доказательство теоремы о полноте.
- Гёдель, К. (1930). «Полнота аксиом исчисления логических функций». Ежемесячные журналы по математике (на немецком языке). 37 (1): 349–360. дои : 10.1007/BF01696781 . ЯФМ 56.0046.04 . S2CID 123343522 . Тот же материал, что и диссертация, за исключением более кратких доказательств, более сжатых объяснений и отсутствия длинного введения.
Внешние ссылки
[ редактировать ]- Стэнфордская энциклопедия философии : « Курт Гёдель » — Джульетты Кеннеди .
- Биография МакТьютора: Курт Гёдель.