Jump to content

Формат файла

(Перенаправлено из форматов файлов )
Duration: 13 seconds.
Wav-file: 2,1 мегабайт.
Duration: 20 seconds.
OGG-FILE: 154 килобита.

Формат файла - это стандартный способ, которым информация кодируется для хранения в компьютерном файле . Он указывает, как биты используются для кодирования информации в цифровой среде хранения . Форматы файлов могут быть либо запатентованными , либо бесплатными .

Некоторые форматы файлов предназначены для очень конкретных типов данных: PNG например, файлы , хранят расированные изображения с использованием сжатия данных без потерь . Другие форматы файлов, однако, предназначены для хранения нескольких различных типов данных: формат OGG может действовать как контейнер для различных типов мультимедиа , включая любую комбинацию аудио и видео , с текстом или без него (такими как субтитры ) и метаданные Полем Текстовый файл может содержать любой поток символов, включая возможные элементы управления , и кодируется в одной из различных схем кодирования символов . Некоторые форматы файлов, такие как HTML , масштабируемая векторная графика и исходный код программного обеспечения, представляют собой текстовые файлы с определенными синтаксисами , которые позволяют использовать их для конкретных целей.

Спецификации

[ редактировать ]

Форматы файлов часто имеют опубликованную спецификацию, описывающую метод кодирования, и позволяет тестирование программы, предназначенной для функциональности. Не все форматы имеют свободно доступные документы спецификации, отчасти потому, что некоторые разработчики рассматривают свои спецификационные документы как коммерческие секреты , а отчасти потому, что другие разработчики никогда не авторитет официального спецификационного документа, позволяя прецеденту, установленным другими уже существующими программами, которые используют формат определяют формат через как Эти существующие программы используют его.

Если разработчик формата не публикует бесплатные спецификации, другой разработчик, желающий использовать этот вид файла, должен либо обратить вспять файл, чтобы узнать, как его прочитать, либо приобрести документ спецификации от разработчиков формата и подписывая Соглашение о неразглашении . Последний подход возможен только тогда, когда существует формальный документ спецификации. Обе стратегии требуют значительного времени, денег или обеих; Следовательно, форматы файлов с общедоступными спецификациями, как правило, поддерживаются большим количеством программ.

Патентное право, а не авторское право , чаще используется для защиты формата файла. Хотя патенты на форматы файлов не разрешены напрямую в соответствии с законодательством США, некоторые форматы кодируют данные с использованием запатентованных алгоритмов . Например, до 2004 года использование сжатия с форматом файла GIF потребовало использования запатентованного алгоритма, и хотя владелец патента изначально не применял свой патент, они позже начали собирать плату за королевскую власть . Это привело к значительному снижению использования GIF и частично отвечает за разработку альтернативного формата PNG . Тем не менее, патент на GIF истек в США в середине 2003 года и по всему миру в середине 2004 года.

Определение типа файла

[ редактировать ]

Различные операционные системы традиционно использовали различные подходы к определению формата конкретного файла, причем каждый подход имеет свои собственные преимущества и недостатки. Большинство современных операционных систем и отдельных приложений должны использовать все следующие подходы для чтения «иностранных» форматов файлов, если не работать с ними полностью.

Расширение имени файла

[ редактировать ]

Один популярный метод, используемый многими операционными системами, включая Windows , MacOS , CP/M , DOS , VMS и VM/CMS , - это определить формат файла на основе конца его имени, более конкретно буквы после окончательного период. Эта часть имени файла известна как расширение имени файла . Например, документы HTML идентифицируются по именам, которые заканчиваются .html (или .htm ) и Gif -изображения .gif . В исходной жирной файловой системе имена файлов были ограничены идентификатором восьмихарактерного и идентификатора и треххарактерным расширением, известным как имя файла 8.3 . Существует ограниченное количество трехбуквенных расширений, что может привести к использованию данного расширения более чем одной программой. Многие форматы по-прежнему используют расширения с тремя символами, даже если современные операционные системы и прикладные программы больше не имеют этого ограничения. Поскольку стандартный список расширений не существует, более одного формата может использовать одно и то же расширение, которое может запутать как операционную систему, так и пользователи.

Одним из артефактов этого подхода является то, что систему можно легко обмануть в обработке файла как к другому формату, просто переименуя его - HTML например, файл можно легко рассматривать как простой текст , переименуя его из filename.html to filename.txt . Хотя эта стратегия была полезна для опытных пользователей, которые могли легко понять и манипулировать этой информацией, часто сбивала с толку меньше технических пользователей, которые могли случайно сделать файл непригодным (или «потерять» ее), неверно переименовав его в переименование.

Это привело к большинству версий Windows и Mac OS, чтобы скрыть расширение при перечислении файлов. Это мешает пользователю случайно изменить тип файла и позволяет опытным пользователям выключать эту функцию и отображать расширения.

Скрытие расширения, однако, может создать внешний вид двух или более идентичных имен файлов в одной и той же папке. Например, логотип компании может потребоваться как в Формат .eps (для публикации) и .png format (для веб -сайтов). С видимыми наращиваниями они появятся как уникальные имена файлов: " CompanyLogo.eps "и" CompanyLogo.png ". С другой стороны, скрытие расширений сделало бы оба как" Компания , что может привести к путанице.

Скрытие расширений также может представлять риск безопасности. [ 1 ] Например, вредоносный пользователь может создать исполняемую программу с невинным именем, таким как " Holiday Photo.jpg.exe "." .exe "будет скрыт, а ничего не подозревающий пользователь увидит" Holiday Photo.jpg », который, казалось бы, был изображение JPEG , обычно неспособное нанести вред машине. Однако операционная система все равно будет видеть» « .exe 'расширение и запустить программу, которая затем сможет причинить вред компьютеру. То же самое относится и к файлам только с одним расширением: поскольку это не показано пользователю, никакая информация о файле не может быть выведена без Явно исследуя файл. .exe ) будет переопределен значком, обычно используемым для представления изображений JPEG, что делает программу похожей на изображение. Расширения также могут быть подделаны: некоторые макрософт -вирусы Microsoft Word создают файл Word в формате шаблона и сохраните его с помощью .doc расширение. Поскольку слово обычно игнорирует расширения и рассматривает формат файла, они будут открываться в виде шаблонов, выполнять и распространять вирус. [ Цитация необходима ] Это представляет собой практическую проблему для систем Windows, где уравновешивание расширения включается по умолчанию.

Внутренние метаданные

[ редактировать ]

Вторым способом определения формата файла является использование информации о формате, хранящемся внутри самого файла, либо информации, предназначенной для этой цели, или двоичных строк , которые всегда находятся в определенных местах в файлах некоторых форматов. Поскольку самое простое место для их поиска находится в начале, такая область обычно называется заголовком файла, когда она больше, чем несколько байтов , или магическое число, если она длится всего несколько байт.

Заголовок файла

[ редактировать ]

Метаданные, содержащиеся в заголовке файла, обычно хранятся в начале файла, но могут присутствовать и в других областях, часто включая конец, в зависимости от формата файла или типа содержащихся данных. Файлы на основе символов (текстовые) обычно имеют заголовки на основе символов, тогда как двоичные форматы обычно имеют двоичные заголовки, хотя это не правило. Текстовые заголовки файлов обычно занимают больше места, но, будучи читаемыми человеком, их можно легко исследовать, используя простое программное обеспечение, такое как текстовый редактор или шестнадцатеричный редактор.

Помимо идентификации формата файла, заголовки файлов могут содержать метаданные в отношении файла и его содержимого. Например, большинство файлов изображений хранят информацию о формате изображения, размере, разрешении и цветовом пространстве , а также к необязательно авторизации информации, такой как то, кто сделал изображение, когда и где было сделано, какая модель камеры и настройки фотографии использовались ( Exif ), и и скоро. Такие метаданные могут использоваться путем чтения программного обеспечения или интерпретации файла в процессе загрузки и впоследствии.

Заголовки файлов могут использоваться операционной системой для быстрого сбора информации о файле, не загружая все в память, но это использует больше ресурсов компьютера, чем чтение непосредственно из информации о каталоге . Например, когда графический файловый диспетчер должен отобразить содержимое папки, он должен прочитать заголовки многих файлов, прежде чем он сможет отобразить соответствующие значки, но они будут расположены в разных местах на среде для хранения, что требует больше времени для доступа Полем Папка, содержащая множество файлов со сложными метаданными, такими как информация о миниатюре , может потребовать значительного времени, прежде чем ее можно будет отображать.

Если заголовок является двоичным жестким кодированием так, что сам заголовок нуждается в сложной интерпретации, чтобы быть распознанным, особенно для саке с защитой содержания метаданных, существует риск того, что формат файла может быть неверно истолкован. Это могло даже быть плохо написано на источнике. Это может привести к повреждению метаданных, которые в чрезвычайно плохих случаях могут даже сделать файл нечитаемым. [ нужно разъяснения ]

Более сложный пример заголовков файлов - это те, которые используются для обертки форматов файлов (или контейнера).

Магическое число

[ редактировать ]

Одним из способов включения метаданных типа файла, часто связанных с UNIX и его производными, является хранение «магического числа» внутри самого файла. Первоначально этот термин использовался для определенного набора 2-байтовых идентификаторов в начале файлов, но, поскольку любая двоичная последовательность может рассматриваться как число, любая функция формата файла, которая уникально различает его для идентификации. GIF Например, изображения всегда начинаются с представления ASCII любого GIF87a или GIF89a, в зависимости от стандарта, к которому они придерживаются. Многие типы файлов, особенно просто текстовые файлы, труднее определить этим методом. Например, файлы HTML могут начаться с строки <html> (что не чувствителен к случаю), или соответствующее определение типа документа , которое начинается с <!DOCTYPE htmlили, для xhtml , идентификатор XML , который начинается с <?xmlПолем Файлы также могут начинаться с HTML -комментариев, случайного текста или нескольких пустых строк, но все же быть полезными HTML.

Подход Magic Number предлагает лучшие гарантии того, что формат будет идентифицирован правильно и часто может определять более точную информацию о файле. Поскольку разумно надежные тесты «магического числа» могут быть довольно сложными, и каждый файл должен эффективно протестирован на всех возможностей в базе данных Magic, этот подход относительно неэффективен, особенно для отображения больших списков файлов (напротив, имя файла и метаданные- Методы, основанные на основе, должны проверить только одну часть данных и сопоставить его с отсортированным индексом). Кроме того, данные должны быть считываются из самого файла, увеличивая задержку, а не метаданные, хранящиеся в каталоге. Там, где типы файлов не поддаются признанию таким образом, система должна вернуться к метаданным. Это, однако, лучший способ для программы проверить, имеет ли файл, который он был представлен для обработки, правильный формат: в то время как имя или метаданные файла могут быть изменены независимо от его содержания, снявшись с хорошо продуманным тестом магического числа является почти уверенным признаком того, что файл либо поврежден, либо неправильный тип. С другой стороны, действительный магический номер не гарантирует, что файл не поврежден или имеет правильный тип.

Так называемые Шебанг линии в файлах скриптов являются особым случаем магических чисел. Здесь магический номер-это читаемый на человеке текст, который идентифицирует конкретный интерпретатор команды и параметры, которые будут переданы в интерпретатор команды.

Другая операционная система, использующая магические номера, - это Amigaos , где магические числа назывались «магическими файлами cookie» и были приняты в качестве стандартной системы для распознавания исполняемых файлов в формате исполняемого файла Hunk , а также для того, чтобы отдельные программы, инструменты и утилиты автоматически справлялись с их сохраненными файлами данных , или любой другой вид типов файлов при сохранении и загрузке данных. Эта система была затем улучшена с помощью данных Amiga стандартной системы распознавания . Другим методом был метод Fourcc , который возникает в Ostype на Macintosh, позже адаптированном с помощью формата файла обмена (IFF) и производных.

Внешние метаданные

[ редактировать ]

Последний способ хранения формата файла - явно хранить информацию о формате в файловой системе, а не в самом файле.

Этот подход защищает метаданные отдельно от основных данных и имени, но также является менее портативным , чем либо расширения имени файла, либо «магические числа», поскольку формат должен быть преобразован из файловой системы в файловую систему. Хотя это также верно в некоторой степени с расширениями имени файла-например, для совместимости с тремя символами MS-DOS -большинство форм хранилища имеют примерно эквивалентное определение данных и имени файла, но может иметь различное или нет представления дальнейших метаданных.

Обратите внимание, что файлы ZIP или архивные файлы решают проблему обработки метаданных. Утилита собирает несколько файлов вместе с метаданными по поводу каждого файла и папков/каталогов, которые они пришли из всех в одном новом файле (например, zip -файл с расширением .zip ). Новый файл также сжат и, возможно, зашифрован, но теперь передается в качестве одного файла в операционных системах с помощью трансмиссий FTP или отправленной по электронной почте в качестве вложения. В пункте назначения, полученный отдельный файл должен быть неразрешенный с помощью совместимой утилиты, чтобы быть полезным. Проблемы обработки метаданных решаются таким образом, используя файлы ZIP или архивные файлы.

Mac OS Type-Codes

[ редактировать ]

OS хранит Mac Иерархическая файловая система коды для создателя и типа как часть записи каталога для каждого файла. Эти коды называются остипами. Эти коды могут быть любой 4-байтовой последовательности, но часто выбирались таким образом, чтобы представление ASCII сформировало последовательность значимых символов, такую ​​как сокращение имени приложения или инициалы разработчика. Например, файл гиперкарты "стека" создателя имеет Дикий от предыдущего названия Hypercard, "Wildcard) и типа ( Стак . В текстовом редакторе BBedit есть код создателя R*ch Ссылаясь на своего первоначального программиста, Рич Зигель . Тип код определяет формат файла, в то время как код создателя указывает программу по умолчанию, чтобы открыть ее, когда он дважды щелкнул пользователем. Например, пользователь может иметь несколько текстовых файлов все с кодом типа Текст , но каждый открыт в другой программе, из -за наличия различных кодов создателей. Эта функция была предназначена для того, чтобы, например, читаемые на человеке файлы простых текстов можно было открыть в текстовом редакторе общего назначения, в то время как программирование или HTML-коды будут открыты в специализированном редакторе или IDE . Тем не менее, эта функция часто была источником путаницы с пользователем, поскольку какая программа будет запущена, когда файлы были дважды щелкнуты, часто была непредсказуемой. RISC OS использует аналогичную систему, состоящую из 12-битного числа, которое можно посмотреть в таблице описаний- гексадецимальное число FF5 «псевдоним» Поздень , представляющий файл PostScript .

идентификаторы типа MacOS (UTI)

[ редактировать ]

Идентификатор единого типа (UTI) - это метод, используемый в MacOS для однозначного идентификации классов «типированных» объектов, таких как форматы файлов. Он был разработан Apple в качестве замены для Ostype (Type & Creator Codes).

UTI является основой основной , которая использует строку обратного DNS . Некоторые общие и стандартные типы используют домен, называемый общественность (например, public.png для портативного сетевого графического изображения), в то время как другие домены могут использоваться для сторонних типов (например, com.adobe.pdf для портативного формата документа ). ИМП может быть определена в иерархической структуре, известной как иерархия соответствия. Таким образом, public.png соответствует супертипу public.image , который сам соответствует супертипу public.data . UTI может существовать в нескольких иерархиях, что обеспечивает большую гибкость.

В дополнение к форматам файлов, ИМП также можно использовать для других объектов, которые могут существовать в macOS, включая:

  • Дата нотора
  • Папки (каталоги)
  • Переводящиеся типы (с помощью менеджера по переводу)
  • Пучки
  • Рамки
  • Потоковые данные
  • Псевдонимы и символики

VSAM Каталог

[ редактировать ]

В IBM OS/VS через Z/OS , каталог VSAM (До каталогов ICF ) и запись объема VSAM в наборе данных VSAM тома (VVD) (с каталогами ICF) идентифицирует тип набора данных vSAM.

В IBM OS/360 через Z/OS в формате 1 или 7 управляющий блок набора данных (DSCB) в таблице содержания громкости (VTOC) идентифицирует Организация набора данных ( DSORG ) описанного им набора данных.

OS/2 расширенные атрибуты

[ редактировать ]

Файлотисты HPFS , FAT12 и FAT16 (но не FAT32) позволяют хранить «расширенные атрибуты» с файлами. Они составляют произвольный набор триплетов с именем, кодированный тип для значения и значение, где имена уникальны, а значения могут длиться до 64 КБ. Существуют стандартизированные значения для определенных типов и имен (под OS/2 ). Одним из таких того, что для определения типа файла используется расширенный атрибут «.Thype». Его значение включает в себя список одного или нескольких типов файлов, связанных с файлом, каждый из которых является строкой, такой как «простой текст» или «HTML -документ». Таким образом, файл может иметь несколько типов.

Файлсистема NTFS также позволяет хранить расширенные атрибуты OS/2, как один из вилок файла , но эта функция просто присутствует для поддержки подсистемы OS/2 (не присутствует в XP), поэтому подсистема Win32 рассматривает эту информацию как непрозрачную Блок данных и не использует его. Вместо этого он опирается на другие вилки файлов для хранения мета-информации в форматах специфичных для WIN32. Расширенные атрибуты OS/2 все еще могут быть прочитаны и написаны программами Win32, но данные должны быть полностью проанализированы по приложениям.

Posix расширенные атрибуты

[ редактировать ]

В Unix и Unix-подобных системах, EXT2 , EXT3 , EXT4 , REISERFS версии 3, XFS , JFS , FFS и HFS+ файловые системы позволяют хранить расширенные атрибуты с файлами. К ним относятся произвольный список строк «name = value», где имена уникальны, а значение можно получить с соответствующим именем.

Уникальные идентификаторы местоимение (PUID)

[ редактировать ]

Постоянный уникальный идентификатор ProMons (PUID) является расширяемой схемой постоянных, уникальных и однозначных идентификаторов для форматов файлов, который был разработан Национальным архивом Великобритании в рамках службы технического регистрации ProNom . PUID могут быть выражены в виде единообразных идентификаторов ресурсов, используя Информация: Promon/ Sampace. Хотя схема PUID еще не широко используется за пределами правительства Великобритании и некоторых программ цифрового сохранения , обеспечивает большую гранулярность, чем большинство альтернативных схем.

Типы мима

[ редактировать ]

Типы MIME широко используются во многих приложениях, связанных с Интернетом , и все чаще в других местах, хотя их использование информации о типе диска встречается редко. Они состоят из стандартизированной системы идентификаторов (управляемой IANA ), состоящей из типа и подтипа , разделенного с помощью череды , например, экземпляра, Текст/HTML или Изображение/GIF . Первоначально они были предназначены как способ определения того, какой тип файла был прикреплен к электронной почте , независимо от исходных и целевых операционных систем. Типы MIME идентифицируют файлы на BEOS , Amigaos 4.0 и Morphos , а также хранят уникальные подписи приложения для запуска приложений. В Amigaos и Morphos система типа MIME работает параллельно с Amiga Special System.

Есть проблемы с типами MIME, хотя; Несколько организаций и людей создали свои собственные типы MIME, не регистрируя их должным образом с помощью IANA, что в некоторых случаях неловко использует этот стандарт.

Идентификаторы формата файлов (FFIDS)

[ редактировать ]

Идентификаторы формата файлов являются другим, не широко используемым способом идентификации форматов файлов в соответствии с их происхождением и их категорией файлов. Он был создан для описания Suite программного обеспечения. Он состоит из нескольких цифр формы NNNNNNNNN-XX-YYYYYYYПолем Первая часть указывает на происхождение/сопровождающее организации (это число представляет значение в базе данных организации компании/стандартов), а 2 следующие цифры классифицируют тип файла в шестнадцатеричной . Окончательная часть состоит из обычного расширения файла файла или международного стандартного номера файла, подготовленного слева с нулями. Например, спецификация файла PNG имеет FFID 000000001-31-0015948 где 31 Указывает файл изображения, 0015948 это стандартное число и 000000001 Указывает Международную организацию по стандартизации (ISO).

Идентификация формата на основе файла на основе содержимого

[ редактировать ]

Еще один менее популярный способ определить формат файла - это изучить содержимое файла для различимых шаблонов между типами файлов. Содержимое файла представляет собой последовательность байтов, а байт имеет 256 уникальных перестановков (0–255). Таким образом, подсчет возникновения байтовых схем, который часто называют распределением частот байтов, дает различимые закономерности для идентификации типов файлов. Существует много схем идентификации типа файла на основе контента, которые используют байтовое распределение частот для создания репрезентативных моделей для типа файла и использования любых статистических методов и методов интеллектуального анализа данных для идентификации типов файлов. [ 2 ]

Структура файла

[ редактировать ]

Существует несколько типов способов структурирования данных в файле. Наиболее обычные описаны ниже.

Неструктурированные форматы (необработанные свалки)

[ редактировать ]

В более ранних форматах файлов использовались необработанные форматы данных, которые состояли из непосредственного сбрасывания изображений памяти одной или нескольких структур в файл.

Это имеет несколько недостатков. Если изображения памяти также не имеют зарезервированных пробелов для будущих расширений, расширение и улучшение этого типа структурированного файла очень сложно. Он также создает файлы, которые могут быть специфичными для одной платформы или языка программирования (например, структура, содержащая строку Pascal , не распознается как таковая в C ). С другой стороны, разработка инструментов для чтения и написания этих типов файлов очень проста.

Ограничения неструктурированных форматов привели к разработке других типов форматов файлов, которые могут быть легко расширены и одновременно быть обратно совместимыми.

Форматы на основе куски

[ редактировать ]

В такой структуре файла каждый кусок данных встроен в контейнер, который каким -то образом идентифицирует данные. Прицел контейнера может быть идентифицирована каким-то стартовым и конечным маркерами, с помощью явного поля длины где-то или фиксированными требованиями определения формата файла.

В течение 1970 -х годов многие программы использовали форматы этого общего рода. Например, такие слова, как Triff , Script и Scribe , и файлы экспорта базы данных, такие как CSV . Electronic Arts и Commodore - Amiga также использовал этот тип формата файла в 1985 году с их форматом файла IFF (File File Interchange).

Контейнер иногда называют «кусочком» , хотя «кусок» также может подразумевать, что каждый кусок маленький, и/или что кусочки не содержат другие куски; Многие форматы не налагают эти требования.

Информацию, которая идентифицирует конкретный «кусок», может быть названа многими разными вещами, часто термины, включая «имя поля», «идентификатор», «метка» или «тег». Идентификаторы часто читают человеку и классифицируют части данных: например, как «фамилия», «адрес», «прямоугольник», «Имя шрифта» и т. Д. Это не то же самое, что идентификаторы в смысле ключа базы данных или серийного номера (хотя идентификатор может вполне идентифицировать связанные с ними данные как такую ​​ключ).

С этим типом структуры файла инструменты, которые не знают определенных идентификаторов куски, просто пропускают те, которые они не понимают. В зависимости от Фактическое значение пропущенных данных, это может быть или не быть полезным ( CSS явно определяет такое поведение).

Эта концепция использовалась снова и снова с помощью RIFF (Microsoft-IBM, эквивалентный IFF), PNG, JPEG Storage, DER ( DISINGINGINGED CODING REGING ) Кодируемые потоки и файлы (которые первоначально были описаны в CCITT X.409: 1984 и, следовательно, предшествует IFF ) и структурированный формат обмена данными (SDXF) .

Действительно, любой формат данных должен каким-то образом определить значение его компонентных частей, а встроенные границы маркеров-очевидный способ сделать это:

  • Заголовки MIME делают это с помощью кишечной метки в начале каждой логической линии. Заголовки MIME не могут содержать другие заголовки MIME, хотя содержание данных некоторых заголовков имеет подразделения, которые могут быть извлечены другими конвенциями.
  • CSV и аналогичные файлы часто делают это с использованием записей заголовка с именами поля и с запятыми, чтобы отметить границы поля. Как и MIME, CSV не имеет никаких положений для структур с более чем одним уровнем.
  • XML и его родственники могут быть свободно рассмотрены своего рода форматом на основе чан, поскольку элементы данных идентифицируются по наценке, которая сродни идентификаторам кусок. Тем не менее, он имеет формальные преимущества, такие как схемы и валидация , а также способность представлять более сложные структуры, такие как деревья , даги и диаграммы . Если XML считается форматом «чанка», то SGML и его предшественник IBM GML являются одними из самых ранних примеров таких форматов.
  • JSON похож на XML без схем, перекрестных ссылок или определения значения повторяющихся полевых названий и часто удобен для программистов.
  • YAML похож на JSON, но используйте отступление, чтобы отделить куски данных и стремиться быть более читаемым человеком, чем JSON или XML.
  • Буферы протокола , в свою очередь, похожи на JSON, в частности, заменяя граничные маркеры в данных с номерами поля, которые отображаются с именами с некоторым внешним механизмом.

Форматы на основе каталогов

[ редактировать ]

Это еще один расширяемый формат, который очень напоминает файловую систему ( документы OLE - это фактические файловые системы), где файл состоит из «записей каталога», которые содержат местоположение данных в самом файле, а также его подписи (и в определенных случаи его тип). Хорошими примерами этих типов файловых структур являются изображения дисков , исполняемые файлы , документы OLE TIFF , библиотеки .

Некоторые форматы файлов, такие как ODT и DOCX, находящиеся на основе PKZIP , оба являются кусочками и несут каталог. [ Цитация необходима ]

Структура формата файла на основе каталогов более легко поддается модификациям, чем неструктурированные или форматы на основе чан. [ Цитация необходима ] Характер этого типа формата позволяет пользователям тщательно строить файлы, которые заставляют программное обеспечение для чтения делать то, что авторы формата никогда не намеревались. Примером этого является zip -бомба . Форматы файлов на основе каталогов также используют значения, которые указывают в других областях в файле, но если некоторые последующие значения данных указывают на данные, которые были прочитаны ранее слепо следует петле. [ Цитация необходима ]

Смотрите также

[ редактировать ]
  1. ^ Мир ПК (23 декабря 2003 г.). «Советы по Windows: по соображениям безопасности платит, чтобы узнать расширения ваших файлов» . Архивировано из оригинала 23 апреля 2008 года . Получено 20 июня 2008 года .
  2. ^ «Идентификация формата файла» . Архивировано из оригинала на 2009-08-14 . Получено 2009-07-21 .
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 58c7308c17b1ae203128d96e55fbdc16__1726557120
URL1:https://arc.ask3.ru/arc/aa/58/16/58c7308c17b1ae203128d96e55fbdc16.html
Заголовок, (Title) документа по адресу, URL1:
File format - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)