Jump to content

Семантический разрыв

Семантический разрыв характеризует различие между двумя описаниями объекта разными языковыми представлениями, например языками или символами. По мнению Андреаса М. Хайна, семантический разрыв можно определить как «разницу в значении между конструкциями, сформированными в разных системах репрезентации». [1] В информатике эта концепция актуальна всякий раз, когда обычная человеческая деятельность, наблюдения и задачи переводятся в вычислительное представление. [2] [3] [1]

Точнее говоря, разрыв означает разницу между неоднозначной формулировкой контекстного знания на мощном языке (например, естественном языке ) и его обоснованным, воспроизводимым и вычислительным представлением на формальном языке (например, языке программирования ). Семантика объекта зависит от контекста, в котором он рассматривается. Для практического применения это означает, что любое формальное представление задач реального мира требует перевода контекстуальных экспертных знаний приложения (высокого уровня) в элементарные и воспроизводимые операции вычислительной машины (низкого уровня). Поскольку естественный язык позволяет выражать задачи, которые невозможно вычислить на формальном языке, нет средств для автоматизации этого перевода в общем виде. Более того, изучение языков в иерархии Хомского показывает, что не существует формального и, следовательно, автоматизированного способа перевода с одного языка на другой, превышающего определенный уровень выразительной силы.

Теоретическая основа [ править ]

Еще не доказанный, но общепринятый тезис Чёрча-Тьюринга гласит, что машина Тьюринга и все эквивалентные формальные языки, такие как лямбда-исчисление, выполняют и представляют все формальные операции соответственно, применяемые вычислительным человеком. Однако выбор адекватных операций для правильного вычисления сам по себе формально не выводим, более того, он зависит от вычислимости основной задачи. Задачи, такие как проблема остановки , могут быть полностью сформулированы на естественном языке, но вычислительное представление не завершается или не дает полезного результата, что доказывается теоремой Райса . Общее выражение ограничений вывода на основе правил теоремой Гёделя о неполноте указывает на то, что семантический разрыв никогда не может быть полностью закрыт. Это общие утверждения, учитывающие обобщенные ограничения вычислений на самом высоком уровне абстракции, где семантический разрыв проявляется . Однако существует множество подмножеств проблем, которые могут быть переведены автоматически, особенно на более высоких уровнях иерархии Хомского.

Формальные языки [ править ]

Задачи реального мира формализуются языками программирования, которые выполняются на компьютерах, основанных на архитектуре фон Неймана . Поскольку языки программирования являются лишь удобным представлением машины Тьюринга, любая программа на компьютере фон Неймана имеет те же свойства и ограничения, что и машина Тьюринга или ее эквивалентное представление. Следовательно, каждый язык программирования, такой как машинный код уровня ЦП, ассемблер или любой язык программирования высокого уровня, обладает той же выразительной силой, которую способна вычислить базовая машина Тьюринга. Между ними нет семантического разрыва , поскольку программа переносится с языка высокого уровня в машинный код с помощью программы, например компилятора , который сам работает на машине Тьюринга без какого-либо взаимодействия с пользователем. Фактически открывается смысловой разрыв между выбором правил и представлением задачи.

последствия Практические

Выбор правил для формального представления реальных приложений соответствует написанию программы. Написание программ не зависит от реального языка программирования и, по сути, требует перевода знаний пользователя, специфичных для предметной области, в формальные правила, управляющие машиной Тьюринга. Именно этот переход от контекстуального знания к формальному представлению не может быть автоматизирован из-за теоретических ограничений вычислений. Следовательно, любое отображение реальных приложений в компьютерные приложения требует от пользователя определенного объема технических знаний, где и семантический разрыв проявляется .

является Фундаментальной задачей разработки программного обеспечения устранение разрыва между знаниями конкретного приложения и технически осуществимой формализацией. Для этого специфичные для предметной области знания (высокого уровня) необходимо перенести в алгоритм и его параметры (низкого уровня). Для этого необходим диалог между пользователем и разработчиком. Aim — это всегда программное обеспечение, которое позволяет пользователю представлять свои знания в виде параметров алгоритма, не зная деталей реализации, и интерпретировать результаты алгоритма без помощи разработчика. Для этой цели пользовательские интерфейсы играют ключевую роль в разработке программного обеспечения, а разработчики поддерживаются фреймворками , которые помогают организовать интеграцию контекстной информации.

Примеры [ править ]

Получение документа [ править ]

Простой пример можно сформулировать как серию все более сложных запросов на естественном языке для поиска целевого документа , который может существовать или не существовать локально в известной компьютерной системе.

Примеры запросов :

  • 1) Найдите любой файл в известном каталоге «/usr/local/funny».
  • 2) Найдите любой файл, в имени которого есть слово «смешно».
  • 3) Найдите любой текстовый файл , в тексте которого встречается слово «смешно» или подстрока «юмор».
  • 4) Найдите любой mp3- файл, в метаданных которого встречается слово «смешно», «комикс» или «юмор».
  • 5) Найдите любой файл любого типа, связанный с юмором.
  • 6) Найдите любое изображение, которое может рассмешить мою бабушку.

Возрастающая сложность этих запросов представлена ​​растущей степенью абстракции от типов и семантики, определяющих архитектуру системы (каталоги и файлы на известном компьютере), к типам и семантике, которые занимают сферу обычного человеческого дискурса (такие темы, как « юмор» и такие сущности, как «моя бабушка»). Более того, это несоответствие областей еще больше усложняется дырявыми абстракциями , как это часто бывает в случае запроса 4), где целевой документ может существовать, но не может инкапсулировать «метаданные» способом, ожидаемым пользователем, или разработчик системы обработки запросов.

Анализ изображения [ править ]

Анализ изображений — типичная область, для которой требуется высокая степень абстракции от низкоуровневых методов и где семантический разрыв сразу же влияет на пользователя. Если содержимое изображения необходимо идентифицировать, чтобы понять значение изображения, единственной доступной независимой информацией являются данные пикселей низкого уровня. Текстовые аннотации всегда зависят от знаний, возможностей выражения и конкретного языка аннотатора и поэтому ненадежны. Чтобы распознать отображаемые сцены по необработанным данным изображения, алгоритмы выбора и манипулирования пикселями должны быть объединены и параметризованы адекватным образом и, наконец, связаны с естественным описанием. Даже простое лингвистическое представление формы или цвета, например круглого или желтого, требует совершенно других методов математической формализации, которые не являются ни интуитивными, ни уникальными, ни надежными.

Семантический разрыв в контексте анализа изображений

Многоуровневые системы [ править ]

Во многих многоуровневых системах некоторые конфликты возникают, когда концепции на высоком уровне абстракции необходимо перевести в более низкие, более конкретные артефакты . Это несоответствие часто называют семантическим разрывом .

Базы данных [ править ]

Сторонники ООСУБД (объектно-ориентированной системы управления базами данных) иногда утверждают, что эти базы данных помогают уменьшить семантический разрыв между областью приложения ( минимиром ) и традиционными системами РСУБД. [4] Однако сторонники реляционной модели утверждают прямо противоположное, поскольку по определению объектные базы данных фиксируют записываемые данные в единой абстракции привязки.

См. также [ править ]

Ссылки [ править ]

  1. ^ Jump up to: Перейти обратно: а б Хейн, AM (2010). «Идентификация и устранение семантических пробелов в контексте многодоменной инженерии» . Тезисы докладов Форума по философии, технике и технологиям 2010 г. Колорадо .
  2. ^ Смолдерс, AWM; и др. (2000). «Поиск изображений на основе контента в конце ранних лет». IEEE Trans Pattern Anal Mach Intell . 22 (12): 1349–80. дои : 10.1109/34.895972 . S2CID   2827898 .
  3. ^ Дораи, К.; Венкатеш, С. (2003). «Преодоление семантического разрыва с помощью вычислительной медиаэстетики». IEEE Мультимедиа . 10 (2): 15–17. дои : 10.1109/MMUL.2003.1195157 . hdl : 10536/DRO/DU:30044313 . S2CID   206477548 .
  4. ^ Шлаттер, М.; и др. (1994). «Система управления бизнес-объектами». IBM Systems Journal . 33 (2): 239–263. дои : 10.1147/sj.332.0239 .
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 1117c4918e432e3148af28720a443023__1699193820
URL1:https://arc.ask3.ru/arc/aa/11/23/1117c4918e432e3148af28720a443023.html
Заголовок, (Title) документа по адресу, URL1:
Semantic gap - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)