Jump to content

Значения, разделенные табуляцией

Значения, разделенные табуляцией
Расширение имени файла .tsv, .tab[ 1 ]
Тип интернет-СМИ
текст/значения, разделенные табуляцией
Единый идентификатор типа (UTI) public.tab-separated-values-text [ 2 ]
конформация ИМВП public.delimited-values-text [ 2 ]
Разработано Университета Миннесоты Internet Gopher Команда

Управление по присвоению номеров в Интернете
Первоначальный выпуск в. июнь 1993 года ; 31 год назад ( 1993-06 )
Тип формата значений, разделенных разделителями Формат
Контейнер для информация базы данных , организованная в виде списков, разделенных полями
Стандартный IANA MIME -тип

Значения, разделенные табуляцией ( TSV ) — это простой текстовый формат файла для хранения табличных данных . [ 3 ] Записи разделяются символами новой строки , а значения внутри записи разделяются символами табуляции . Таким образом, формат TSV представляет собой формат значений, разделенных разделителями , аналогичный значениям, разделенным запятыми .

TSV — это простой формат файлов, который широко поддерживается, поэтому его часто используют при обмене данными для перемещения табличных данных между различными компьютерными программами, поддерживающими этот формат. Например, файл TSV можно использовать для переноса информации из базы данных в электронную таблицу .

Заголовок набора данных цветка ириса можно сохранить как TSV, используя следующий простой текст (обратите внимание, что при рендеринге HTML табуляция может преобразовываться в пробелы):

Sepal length	Sepal width	Petal length	Petal width	Species
5.1	3.5	1.4	0.2	I. setosa
4.9	3.0	1.4	0.2	I. setosa
4.7	3.2	1.3	0.2	I. setosa
4.6	3.1	1.5	0.2	I. setosa
5.0	3.6	1.4	0.2	I. setosa

Простой текст TSV выше соответствует следующим табличным данным:

Длина чашелистика Ширина чашелистика Длина лепестка Ширина лепестка Разновидность
5.1 3.5 1.4 0.2 Я. шелковистый
4.9 3.0 1.4 0.2 Я. шелковистый
4.7 3.2 1.3 0.2 Я. шелковистый
4.6 3.1 1.5 0.2 Я. шелковистый
5.0 3.6 1.4 0.2 Я. шелковистый

Персонаж убегает

[ редактировать ]

Стандарт IANA типа носителя для TSV обеспечивает простоту, просто запрещая вкладку табуляции внутри полей. [ 4 ]

Поскольку значения в формате TSV не могут содержать литералы табуляции или символы новой строки , необходимо соглашение для преобразования текстовых значений с этими символами без потерь. Распространенным соглашением является выполнение следующих escape-побегов : [ 5 ] [ 6 ]

escape-последовательность значение
\n перевод строки
\t вкладка
\r возврат каретки
\\ обратная косая черта

Другим распространенным соглашением является использование соглашения CSV из RFC   4180 и заключите значения, содержащие символы табуляции или новой строки, в двойные кавычки. Это может привести к двусмысленности. [ 7 ] [ 8 ]

Окончания строк

[ редактировать ]

Записи обычно разделяются переводом строки, как это типично для платформ Unix, или возвратом каретки и переводом строки, как это типично для платформ Microsoft. Некоторые программы могут ожидать последнего. Де-факто спецификация [ 9 ] указывает, что записи разделены символом EOL , но не указывает конкретную новую строку .

См. также

[ редактировать ]
  1. ^ Университет Эдина. Группа поддержки исследовательских данных. «Выберите лучшие форматы файлов» . Эдинбургский университет. § Форматы, которые мы рекомендуем . Проверено 23 мая 2023 г.
  2. ^ Перейти обратно: а б "tabSeparatedText" . Документация разработчика Apple: унифицированные идентификаторы типов . Apple Inc. Проверено 23 мая 2023 г.
  3. ^ «Как использовать файлы со значениями, разделенными табуляцией (TSV)» . Международный валютный фонд . Проверено 1 февраля 2023 г.
  4. ^ Линднер 1993 .
  5. ^ Дусек, Джейсон (6 мая 2014 г.). «Линейное TSV: простые, линейно-ориентированные, табличные данные» . Протоколы данных - Фонд открытых знаний (изд. v1.0β).
  6. ^ Долан, Стивен (1 ноября 2018 г.). " Руководство по jq " . jq . Проверено 23 мая 2023 г.
  7. ^ Миллер, Роб (22 сентября 2015 г.). Обработка текста с помощью Ruby: извлеките ценность из данных, которые вас окружают . Прагматичная книжная полка. п. 94. ИСБН  978-1-68050-492-7 .
  8. ^ Джузеппини, Габриэле; Бернетт, Марк (10 февраля 2005 г.). Набор инструментов Microsoft Log Parser Toolkit: полный набор инструментов для недокументированного инструмента анализа журналов Microsoft . Эльзевир. п. 311. ИСБН  978-0-08-048939-1 .
  9. ^ «IANA: текст/значения, разделенные табуляцией» .

Источники

[ редактировать ]

Дальнейшее чтение

[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 7ad8109a4ec42d079df930e36564a31d__1701329280
URL1:https://arc.ask3.ru/arc/aa/7a/1d/7ad8109a4ec42d079df930e36564a31d.html
Заголовок, (Title) документа по адресу, URL1:
Tab-separated values - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)