Значения, разделенные табуляцией
Расширение имени файла | .tsv , .tab [ 1 ] |
---|---|
Тип интернет-СМИ |
текст/значения, разделенные табуляцией |
Единый идентификатор типа (UTI) | public.tab-separated-values-text [ 2 ] |
конформация ИМВП | public.delimited-values-text [ 2 ] |
Разработано | Университета Миннесоты Internet Gopher Команда Управление по присвоению номеров в Интернете |
Первоначальный выпуск | в. июнь 1993 года |
Тип формата | значений, разделенных разделителями Формат |
Контейнер для | информация базы данных , организованная в виде списков, разделенных полями |
Стандартный | IANA MIME -тип |
Значения, разделенные табуляцией ( TSV ) — это простой текстовый формат файла для хранения табличных данных . [ 3 ] Записи разделяются символами новой строки , а значения внутри записи разделяются символами табуляции . Таким образом, формат TSV представляет собой формат значений, разделенных разделителями , аналогичный значениям, разделенным запятыми .
TSV — это простой формат файлов, который широко поддерживается, поэтому его часто используют при обмене данными для перемещения табличных данных между различными компьютерными программами, поддерживающими этот формат. Например, файл TSV можно использовать для переноса информации из базы данных в электронную таблицу .
Пример
[ редактировать ]Заголовок набора данных цветка ириса можно сохранить как TSV, используя следующий простой текст (обратите внимание, что при рендеринге HTML табуляция может преобразовываться в пробелы):
Sepal length Sepal width Petal length Petal width Species 5.1 3.5 1.4 0.2 I. setosa 4.9 3.0 1.4 0.2 I. setosa 4.7 3.2 1.3 0.2 I. setosa 4.6 3.1 1.5 0.2 I. setosa 5.0 3.6 1.4 0.2 I. setosa
Простой текст TSV выше соответствует следующим табличным данным:
Длина чашелистика | Ширина чашелистика | Длина лепестка | Ширина лепестка | Разновидность |
---|---|---|---|---|
5.1 | 3.5 | 1.4 | 0.2 | Я. шелковистый |
4.9 | 3.0 | 1.4 | 0.2 | Я. шелковистый |
4.7 | 3.2 | 1.3 | 0.2 | Я. шелковистый |
4.6 | 3.1 | 1.5 | 0.2 | Я. шелковистый |
5.0 | 3.6 | 1.4 | 0.2 | Я. шелковистый |
Персонаж убегает
[ редактировать ]Стандарт IANA типа носителя для TSV обеспечивает простоту, просто запрещая вкладку табуляции внутри полей. [ 4 ]
Поскольку значения в формате TSV не могут содержать литералы табуляции или символы новой строки , необходимо соглашение для преобразования текстовых значений с этими символами без потерь. Распространенным соглашением является выполнение следующих escape-побегов : [ 5 ] [ 6 ]
escape-последовательность | значение |
---|---|
\n
|
перевод строки |
\t
|
вкладка |
\r
|
возврат каретки |
\\
|
обратная косая черта |
Другим распространенным соглашением является использование соглашения CSV из RFC 4180 и заключите значения, содержащие символы табуляции или новой строки, в двойные кавычки. Это может привести к двусмысленности. [ 7 ] [ 8 ]
Окончания строк
[ редактировать ]Записи обычно разделяются переводом строки, как это типично для платформ Unix, или возвратом каретки и переводом строки, как это типично для платформ Microsoft. Некоторые программы могут ожидать последнего. Де-факто спецификация [ 9 ] указывает, что записи разделены символом EOL , но не указывает конкретную новую строку .
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Университет Эдина. Группа поддержки исследовательских данных. «Выберите лучшие форматы файлов» . Эдинбургский университет. § Форматы, которые мы рекомендуем . Проверено 23 мая 2023 г.
- ^ Перейти обратно: а б "tabSeparatedText" . Документация разработчика Apple: унифицированные идентификаторы типов . Apple Inc. Проверено 23 мая 2023 г.
- ^ «Как использовать файлы со значениями, разделенными табуляцией (TSV)» . Международный валютный фонд . Проверено 1 февраля 2023 г.
- ^ Линднер 1993 .
- ^ Дусек, Джейсон (6 мая 2014 г.). «Линейное TSV: простые, линейно-ориентированные, табличные данные» . Протоколы данных - Фонд открытых знаний (изд. v1.0β).
- ^ Долан, Стивен (1 ноября 2018 г.). " Руководство по jq " . jq . Проверено 23 мая 2023 г.
- ^ Миллер, Роб (22 сентября 2015 г.). Обработка текста с помощью Ruby: извлеките ценность из данных, которые вас окружают . Прагматичная книжная полка. п. 94. ИСБН 978-1-68050-492-7 .
- ^ Джузеппини, Габриэле; Бернетт, Марк (10 февраля 2005 г.). Набор инструментов Microsoft Log Parser Toolkit: полный набор инструментов для недокументированного инструмента анализа журналов Microsoft . Эльзевир. п. 311. ИСБН 978-0-08-048939-1 .
- ^ «IANA: текст/значения, разделенные табуляцией» .
Источники
[ редактировать ]- «TSV — Значения, разделенные табуляцией» (изд. от 11 февраля 2021 г.). Библиотека Конгресса. fdd000533 . Проверено 23 мая 2023 г.
- Линднер, Пол (июнь 1993 г.). «Определение значений, разделенных табуляцией (tsv)». значения, разделенные текстом/табуляцией . Управление по присвоению номеров в Интернете . Миннесота: Университета Миннесоты Команда Internet Gopher . Проверено 23 мая 2023 г.
{{cite book}}
:|work=
игнорируется ( помогите )
Дальнейшее чтение
[ редактировать ]- Юкка, Корпела (1 сентября 2000 г.). «Значения, разделенные табуляцией (TSV): формат для обмена табличными данными» (изд. от 12 февраля 2005 г.) . Проверено 23 мая 2023 г.
- Велиндер, Мортен (19 декабря 2012 г.). «§14.2.3 — Форматы текстовых файлов» . Руководство Gnumeric (изд. v1.12) . Проверено 23 мая 2023 г.