Классификация кодирования информации
Классификация кодирования информации ( ICC ) — это система классификации, охватывающая почти все существующие 6500 областей знаний ( областей знаний ). Ее концептуализация выходит за рамки хорошо известных систем классификации библиотек, таких как Десятичная классификация Дьюи (DDC), Универсальная десятичная классификация (UDC) и Классификация Библиотеки Конгресса (LCC), распространяясь также на системы знаний , которые до сих пор не были разработаны. позволил классифицировать литературу . ICC фактически представляет собой гибкую универсальную систему заказа как литературы, так и других видов информации , выделенных в области знаний. С методологической точки зрения ICC отличается от вышеупомянутых систем по следующим трем направлениям:
- Ее основные занятия основаны не на дисциплинах , а на девяти живых стадиях развития, так называемых онтических уровнях.
- Он грубо разбивает их на иерархические ступени еще по девяти категориям , что делает возможным кодирование десятичных чисел.
- Содержание области знаний размечено с помощью цифровой позиционной схемы, в результате чего первая иерархическая ступень относится к девяти онтическим уровням (предметным областям как предметным категориям), а вторая иерархическая ступень относится к девяти функционально упорядоченным категориям форм.
Соответствующие области знаний позволяют по тому же принципу спускаться на третий и четвертый уровень и даже дальше на пятый и шестой уровень. Наконец, подразделения области знаний должны будут соответствовать указанной схеме цифровых позиций.Следовательно, для данной области знаний одинаковые коды будут обозначать одинаковые категории под соответствующими номерами системы кодирования. Этот мнемотехнический аспект системы помогает запоминать и сразу находить местонахождение соответствующих междисциплинарных и трансдисциплинарных полей.
Первые два иерархических уровня можно рассматривать как верхнюю или верхнюю онтологию для онтологий и других приложений.
Термины первых трех иерархических уровней были изложены на немецком и английском языках в организации знаний. Развитие, задача, применение, будущее , [1] на стр. 82–100. Он был опубликован в 2014 году и доступен пока только на немецком языке. Тем временем были собраны также французские термины в областях знаний.Компетенция по обслуживанию и дальнейшему развитию принадлежит немецкому отделению Международное общество организации знаний (ISKO) eV
Историческое развитие
[ редактировать ]В конце 1970 года профессор Алвин Димер из Дюссельдорфского университета предложил Ингетраут Дальберг написать философскую диссертацию на тему « Универсальная классификационная система знаний, ее онтологические, эпистемологические и информационно-теоретические основы» . Димер имел в виду новаторский онтологический подход к такой системе, основанный на всем спектре видов бытия и отвечающий гносеологическим требованиям. Третье требование уже каким-то образом учитывалось в Индийской классификации двоеточий , однако оно все еще требовало пояснений и дополнений. В 1974 году диссертация была опубликована на немецком языке под названием Grundlagen Universaler Wissensordnung . [2] Все началось с концептуальных разъяснений, а также того, почему и как термин «универсальный» связан со знаниями, включая такие области знаний, как товароведение, артефакты, статистика, патенты, стандартизация, связь, коммунальные услуги и т. д. В главе 3 были представлены, проанализированы и сравнены шесть универсальных классификационных систем (DDC, UDC, LCC, BC, CC и BBK).
Готовя диссертацию, Дальберг начал с разработки новой универсальной системы, сначала почерпнув из имеющихся справочных источников множество дошедших до нас обозначений областей знаний. Это финансировалось Немецким обществом документации (DGD) (1971-2) под названием « Порядковая система областей знаний» . Кроме того, учебные программы немецких университетов и политехнических институтов были исследованы на наличие соответствующих терминов и задокументированы (1975 г.). В дальнейшем показалось необходимым добавить определения из специальных словарей и энциклопедий; вскоре выяснилось, что 12 500 терминов включали множество синонимов, так что вся коллекция сводилась примерно к 6 500 концептуальным обозначениям (Проект Logstruktur, поддержанный Немецким научным фондом (DFG) 1976-78).
Результат этой работы [2] была формулировка 30 тезисов, которые в итоге превратились в 12 принципов новой системы, опубликованных 40 лет спустя под. [1] Эти принципы относятся не только к теоретическим основам, но также к структуре и другим организационным аспектам всего массива областей знаний. В 1974 году уже была разработана схема цифрового положения полевого подразделения, позволяющая классифицировать классификационную литературу в библиографическом разделе первого выпуска Journal International Classification. В 1977 году весь ICC был готов к презентации на семинаре в Бангалоре, Индия. [3] Однако публикация первых трех иерархических уровней появилась только в 1982 году. [4] Он был применен к библиографии систем классификации и тезаурусов в томе 1 Международной библиографии по классификации и индексированию; [5] он был обновлен. [1]
Руководящие принципы
[ редактировать ]Они были полностью опубликованы в книге « Организация знаний». Развитие, задача, применение, будущее [1] и статья «Классификация кодирования информации». История, принципы, содержание , [6] поэтому достаточно лишь упомянуть их темы с некоторыми необходимыми дополнениями.
- Принцип 1: Концептуально-теоретические подходы. Концепты являются содержанием МКК, под ними понимаются единицы знаний. «Рождение» концепции. Откуда берутся характеристики, элементы знаний? Как возникают концептуальные отношения?
- Принцип 2: Четыре вида концептуальных отношений и их приложения.
- Принцип 3: Десятичные числа образуют коды ICC как универсальный язык.
- Принцип 4: Девять онтических уровней МКК. Они были сгруппированы под тремя заголовками: «Пролегомены» (1–3), «Науки о жизни» (4–6) и «Производство человека» (7–9):
- Структура и форма
- Материя и энергия
- Космос и земля
- Биосфера
- Антропосфера
- Социосфера
- Материальные продукты (экономика и технология)
- Интеллектуальные продукты (знания и информация)
- Духовные продукты (продукты разума и культуры)
- Принцип 5: Области знаний структурированы по категориям на основе аристотелевских форм-категорий в соответствии с цифровой позиционной схемой, своего рода правилом масштабирования для подразделения данной области следующим образом:
- Общая область: проблемы, теории, принципы (аксиома и структура)
- Предметная область: предметы, виды, части, свойства предметов.
- Область деятельности: методы, процессы, мероприятия
- Свойства поля или первая характеристика
- Лица или вторичная характеристика
- Общества или третичная характеристика
- Влияния извне
- Применение этой области в других областях
- Полевая информация и синтезирующие задачи
- Схема цифровых позиций, называемая Систематификатором, также использовалась для структурирования всей системы посредством категорий, фигурирующих на верхнем нулевом уровне.
Примером его применения является структура системы классификации литературы по организации знаний Gliederung der Klassifikationsliteratur . (Упрощенная версия с дополнительным введением приведена в: [1] п. 71)
- Принцип 6: Онтические уровни, описанные в принципе 4, соответствуют «теории интегративных уровней», что означает, что каждый уровень интегрирован в следующий. При этом каждая область знаний предполагает следующую.
- Принцип 7: Потенциал объединения областей знаний (междисциплинарность и трансдисциплинарность) определяется схемой цифровой позиции. (Примеры приведены в [1] п. 103-4)
- Принцип 8: Категории нулевого уровня являются общими понятиями, их возможные подразделения когда-то могли использоваться для классификационных утверждений. (Эти подразделения еще нуждаются в доработке)
- Принципы 9 и 10: Они касаются возможности сочетания классификационных утверждений с концепциями пространства и времени. (Еще в разработке)
- Принцип 11: Мнемотехнический аспект системы опирается на фиксированные коды позиции системы и на формальные и предметные категории 3х3.
- Принцип 12: Комбинированный потенциал системных позиций 1, 8 и 9 превращает ICC в самосетевую систему, соответствующую современному научному развитию.
В матричной форме
[ редактировать ]Первые два уровня ICC можно представить следующей матрицей.
Первый иерархический уровень из 9 предметных категорий получается из первого вертикального массива под кодами 1–9. Второй иерархический уровень предметных категорий структурирован девятью функционально упорядоченными формами категорий, перечисленными в первой горизонтальной строке под кодами 01-09. Некоторые исключения упомянуты в принципе 7.
Исследовать
[ редактировать ]Исследование автоматической классификации
[ редактировать ]Для классификации веб-документов, предложенной Йенсом Хартманном из Университета Карлсруэ, профессор Вальтер Кох из Университета Граца исследовал в своем Институте исследований прикладных информационных технологий (AIT) применение ICC для автоматической классификации метаданных примерно 350 000 документов. Этому способствовали данные, полученные в рамках проекта EuropeanaLocal, поддерживаемого ЕС . Для этого исследования были использованы три иерархических уровня ICC примерно для 5000 терминов. Результат описан в отчете Кристофа Мака. [7] Профессор Кох расценил степень классификации почти 50% как хороший результат, учитывая, что использовалась только сокращенная версия ICC. Для достижения лучшего результата понадобилось бы 1–2 года. В ходе этих исследований также можно получить указатель всех терминов с их кодами.
Связь данных
[ редактировать ]Вдохновленный работой итальянской исследовательской группы в Тренто по пересмотру иерархии доменов Wordnet: семантика, покрытие и балансировка , [8] с помощью которых использовались коды DDC, профессор Эрнесто Уильям Де Лука и др. показали в исследовании, что в таком случае использование ICC может привести к существенно лучшим результатам. Это было показано в двух статьях: Включение областей знаний из ICC в многоязычное облако лексических связанных данных (LLD). [9] и Многоязычное облако лексически связанных данных: возможная оптимизация доступа? , [10] в котором LLD использовался в метамодели, содержащей все ресурсы с возможностью поиска и навигации по данным с разных аспектов. Таким образом, существующая работа по многим тысячам областей знаний (ICC) может быть объединена с многоязычным облаком лексических связанных данных, основанным на RDF/OWL-представлении EuroWordNet и аналогичных интегрированных лексических ресурсах (MultiWordNet, MEMODATA и Hamburg Metapher BD).
Семантическое веб-структурирование
[ редактировать ]В октябре 2013 года ученый-компьютерщик Герман Бенсе из Дортмунда исследовал возможности структурирования семанической сети с помощью кодов ICC. Он разработал два подхода к графическому представлению областей знаний с их возможными подразделениями. Графическое представление этих областей знаний, относящихся к первым двум уровням, можно найти в разделе «Онтология4» . Включение третьего иерархического уровня предусмотрено в качестве следующего шага.
Некоторые потенциальные применения ICC в его нынешней форме
[ редактировать ]- Возможность грубо структурировать документы, особенно библиографии и справочные материалы.
- Структурирование личных репертуаров, например « Кто есть кто» в разделе «Кто есть кто» в классификации и индексировании. [11]
- Поддержка запоминания статистических данных по областям знаний, например, в отношении профессоров университетов, статистики академий, учреждений, преподавателей специального образования.
- Издательства могли бы использовать коды ICC для своей продукции, чтобы в дальнейшем ее можно было сортировать по областям знаний.
- В качестве стандартной классификации ICC может использоваться во многих случаях, особенно в промышленности, управлении знаниями и инженерии знаний .
- С определением всех его терминов можно было бы опубликовать словарь областей знаний. Это также можно использовать для подобной лексики на других языках. [12]
- Например, ICC можно использовать для сравнения текущей научной деятельности в европейском или мировом масштабе.
- ICC также может быть подходящим инструментом для переключения между существующими универсальными классификационными системами. [13]
- ICC также может быть подходящей «системой зависания» для специальных систем классификации, например, для систем специальных терминологических понятий.
- ICC в его трех иерархиях и соответствующие объяснения могут также использоваться в высшем образовании, чтобы предоставить молодежи обзор областей знаний и понимание взаимосвязей во всем человеческом знании.
- Подобно Единой системе медицинских языков (UMLS) для медицины, такая Единая система областей знаний может быть доступна на многих языках и, таким образом, достигать глобального понимания областей знаний.
- Алфавитный указатель всех концепций областей знаний можно использовать для сравнения с другими подобными указателями, чтобы помочь найти недостающие поля в различных универсальных классификационных системах.
Ссылки
[ редактировать ]- ^ Jump up to: а б с д и ж Ингетраут Дальберг (2014), Немецкая секция Международного общества организации знаний eV (ISKO) (редактор), «Организация знаний. Развитие, задачи, применение, будущее», Учебники по организации знаний (на немецком языке), vol. 3, Вюрцбург: Ergon Verlag, стр. 1–175, ISBN. 978-3-95650-065-7
- ^ Jump up to: а б Ингетраут Дальберг (1974), Немецкое общество документации (ред.), Основы универсального порядка знаний. Проблемы и возможности универсальной системы классификации знаний: все еще доступно в антикварных книжных магазинах, а также в виде печати по запросу от deGruyter (на немецком языке), Пуллах под Мюнхеном: Verlag Documentation, ISBN 978-3111412672
- ^ Ингетраут Дальберг (1978), Фонд библиотечного дела Сарады Ранганатана (редактор), Онтические структуры и универсальная классификация (на немецком языке), Бангалор
{{citation}}
: CS1 maint: отсутствует местоположение издателя ( ссылка ) - ^ Ингетраут Дальберг (1982), «ICC – Классификация кодирования информации. Принципы, структура и возможности применения», Международная классификация (на немецком языке), vol. 2, стр. 98–103.
- ^ Ингетраут Дальберг, изд. (1982), «Международная библиография по классификации и индексированию (ICIB 1): Системы классификации и тезаурусы 1950–1982», Международный журнал организации знаний (на немецком языке), Франкфурт: INDEKS Verlag, ISSN 0943-7444
- ^ Ингетраут Дальберг (2010), Марлис Окенфельд (редактор), «Классификация кодирования информации. История, принципы, содержание», Information, Science & Practice (на немецком языке), vol. 61, выпуск 8, Де Грюйтер, стр. 449–454, ISSN 1619–4292.
- ^ Кристиан Мак (2011), «Категоризация базы данных EuropeanaLocal-Austria на основе ICC», отчет института «Общество исследований прикладных информационных технологий MBH» (AIT) (на немецком языке), Грац
- ^ Луиза Бентивольи; Памела Форнер; Бернардо Маньини; Эмануэле Пианта (2004 г.), «Пересмотр иерархии доменов WordNet: семантика, охват и балансировка» (PDF) , Материалы семинара COLING 2004 г. по «Многоязычным лингвистическим ресурсам » (на немецком языке), Женева, Швейцария, стр. 101–108.
- ^ Эрнесто Уильям ДеЛука; и др. (2014), «Включение областей знаний из ICC в многоязычное облако лексически связанных данных», Организация знаний в 21 веке. Между историческими закономерностями и перспективами на будущее. Proc.13-го Межд. Конференция ИСКО. (на немецком языке), Кракау, Полен, стр. 258–365.
- ^ Эрнесто Уильям ДеЛука; и др. (2014), «Многоязычное облако лексически связанных данных: возможная оптимизация доступа?», Information, Science & Practice (на немецком языке), vol. 65, выпуск 4–5, Де Грюйтер, стр. 279–287, ISSN 1619–4292.
- ^ Ингетраут Дальберг, изд. (1983), Кто есть кто в классификации и индексировании (на немецком языке), Франкфурт: INDEKS Verlag
- ^ Ингетраут Дальберг (2012), «Новый систематический лексикон всех областей знаний, основанный на классификации кодирования информации», Knowledge Organization 39, № 2 (на немецком языке), стр. 142–150.
- ^ Ингетраут Дальберг (1996), Грин Р. (редактор), «Библиотечные каталоги и Интернет. Переключение для будущего предметного доступа», Организация знаний и изменения. Proc.4th Int.ISKO Conf., Вашингтон, округ Колумбия (на немецком языке), Франкфурт: INDEKS Verlag, стр. 155–165.