Разделитель слов
Эта статья включает список литературы , связанную литературу или внешние ссылки , но ее источники остаются неясными, поскольку в ней отсутствуют встроенные цитаты . ( сентябрь 2022 г. ) |
Разделитель слов | |||||||
---|---|---|---|---|---|---|---|
|
В пунктуации разделитель слов — это форма глифа , который разделяет написанные слова . В языках, использующих латиницу , кириллицу и арабский алфавит , а также другие письменности Европы и Западной Азии, разделителем слов является пробел или пробел . Эта конвенция распространяется вместе с другими аспектами европейской пунктуации в Азию и Африку, где слова обычно пишутся без разделения слов. [1] [ нужен лучший источник ]
При кодировании символов сегментация слов зависит от того, какие символы определены как разделители слов.
История
[ редактировать ]В Древнем Египте определители могли использоваться как для обозначения границ слов, так и для устранения неоднозначности семантики слов. [2] Редко в ассирийской клинописи , но обычно в более позднем клинописном угаритском алфавите для разделения слов использовалась вертикальная черта 𒑰. В древнеперсидской клинописи использовался диагонально наклоненный клин 𐏐. [3]
По мере распространения алфавита по всему древнему миру слова часто соединялись вместе, не разделяясь, и эта практика сохраняется или сохранялась до недавнего времени в большей части Южной и Юго-Восточной Азии. Однако нередко в надписях вертикальная черта, а в рукописях — одинарный (·), двойной (:) или тройной (⫶) межпунктовый знак для разделения слов использовалась (точка). Эта практика была обнаружена в финикийском , арамейском , иврите , греческом и латыни и продолжается сегодня в эфиопском языке , хотя и там пробелы набирают силу.
Продолжение письма
[ редактировать ]Ранние системы алфавитного письма, такие как финикийский алфавит , имели только знаки для согласных (хотя некоторые знаки для согласных могли обозначать и гласные , так называемые matres lectionis ). Без каких-либо видимых разделителей слов разбор текста на отдельные слова был бы загадкой. С появлением в греческом алфавите букв, обозначающих гласные , необходимость в разделении между словами уменьшилась. В самых ранних греческих надписях использовались интерпункты, как это было принято в предшествующих им системах письма, но вскоре практика scriptio continua , непрерывного письма, в котором все слова соединялись вместе, не разделяясь, стала обычным явлением.
Типы
[ редактировать ]Никто
[ редактировать ]Алфавитное письмо без разделения между словами, известное как scriptio continua , использовалось в Древнем Египте. Он появился в постклассической латыни после нескольких столетий использования интерпункта.
Традиционно scriptio continua использовался для индийских алфавитов Южной и Юго-Восточной Азии и хангыля Кореи, но теперь пробелы используются в хангыле и все чаще в индийских алфавитах.
Сегодня китайский и японский языки являются наиболее широко используемыми алфавитами, которые последовательно пишутся без знаков препинания для разделения слов, хотя другие сценарии, такие как тайский и лаосский, также следуют этому соглашению. В классическом китайском языке слово и иероглиф были почти одним и тем же, поэтому разделители слов были бы излишними. Хотя в современном мандаринском языке имеется множество многосложных слов, и каждый слог пишется отдельным символом, концептуальная связь между символом и словом или, по крайней мере, морфемой остается сильной, и нет необходимости в разделении слов кроме того, что уже обеспечивают символы. Эта ссылка также имеется на вьетнамском языке ; однако во вьетнамском алфавите практически все слоги разделены пробелами, независимо от того, образуют ли они границы слов или нет.
Космос
[ редактировать ]Пробел — наиболее распространенный разделитель слов, особенно в латинице .
Вертикальные линии
[ редактировать ]В древних письменных и клинописных письмах, таких как анатолийские иероглифы, разделения слов часто использовались короткие вертикальные линии, как и в линейном письме B. для В рукописях для больших разрывов чаще использовались вертикальные линии, эквивалентные латинской запятой и точке. Так было с библейским ивритом ( пасек ) и продолжается сегодня во многих индийских письменностях ( данда ).
Интерпункт, множественные точки и гиподиастола
[ редактировать ]оружие·virvmqve·cano·troiae·qvi·primvs·ab·oris Италия·фато·профвгвс·лавиниакве·венит берега·mvltvm·он·et·terris·iactatvs·et·alto vi·svpervm·saeva·memor·ivnon·ob·ire |
Латинский интерпункт |
Как отмечалось выше, одинарный и двойной интерпункт использовался в рукописях (на бумаге) по всему древнему миру. Например, в эфиопских надписях использовалась вертикальная линия, тогда как в рукописях использовались двойные точки (፡), напоминающие двоеточие. Последняя практика продолжается и сегодня, хотя в космосе происходит все большее распространение. Классическая латынь использовала интерпункт как в бумажных рукописях, так и в надписях на камнях. [5] В древнегреческой орфографии в качестве разделителей слов использовались от двух до пяти точек, а также гиподиастола .
Различные формы букв
[ редактировать ]В современных еврейском и арабском алфавитах некоторые буквы имеют разные формы в конце и/или начале слов. Это разграничение используется в дополнение к интервалу.
Вертикальное расположение
[ редактировать ]исламской насталик В форме каллиграфии для разделения слов используется вертикальное расположение. Начало каждого слова пишется выше конца предыдущего слова, поэтому строка текста приобретает пилообразный вид. Насталик распространился из Персии и сегодня используется в персидском , уйгурском , пушту и урду .
Пауза
[ редактировать ]В пальчиковом написании и азбуке Морзе слова разделяются паузой.
Юникод
[ редактировать ]Для использования на компьютерах эти знаки имеют коды в Юникоде :
- U+007C | ВЕРТИКАЛЬНАЯ ЛИНИЯ ( |, |, | ) [ нужна ссылка ]
- U+00B7 · СРЕДНЯЯ ТОЧКА ( ·, ·, · )
- U + 1361 ፡ ЭФИОПСКОЕ ПРОСТРАНСТВО СЛОВ
См. также
[ редактировать ]- Пробелы
- Расстояние между предложениями
- Сегментация речи
- Несоединяемый элемент нулевой ширины
- Пространство нулевой ширины
- Заменить пробел
- Подчеркивание
Ссылки
[ редактировать ]- ^ (Сенгер 2000)
- ^ «Определители являются наиболее важным средством повышения разборчивости, поскольку они являются легко распознаваемыми разделителями слов». (Ритнер 1996:77)
- ^ Кинг, Леонард Уильям (1901). Ассирийская клинопись . Нью-Йорк: AMS Press. п. 42.
- ^ Издательство Чикагского университета (1911). Руководство по стилю: сборник типографских правил, регулирующих публикации Чикагского университета, с образцами шрифтов, используемых в University Press (Третье изд.). Чикаго: Чикагский университет. п. 101 .
эта линия разделена пробелами.
- ^ (Винго 1972:16)
Дальнейшее чтение
[ редактировать ]- Дэниелс, Питер Т.; Брайт, Уильям, ред. (1996). Мировые системы письменности . Издательство Оксфордского университета .
- Найт, Стэн (1996). «Римский алфавит». В Дэниэлсе, Питер Т.; Брайт, Уильям (ред.). Мировые системы письменности . Издательство Оксфордского университета .
- Ритнер, Роберт (1996). «Египетская письменность». В Дэниэлсе, Питер Т.; Брайт, Уильям (ред.). Мировые системы письменности . Издательство Оксфордского университета .
- Сенгер, Пол (2000). Пространство между словами: истоки чтения без звука . Издательство Стэнфордского университета . ISBN 0-8047-4016-Х .
- Винго, Э. Ота (1972). Латинская пунктуация в классическую эпоху . Мутон. п. 16 .