Базовый латинский алфавит ISO
— Базовый латинский алфавит ISO это международный стандарт (начиная с ISO/IEC 646 ) для латинского алфавита , который состоит из двух наборов ( прописных и строчных) из 26 букв, кодифицированных в [1] различные национальные и международные стандарты и широко используются в международном общении . Это те же самые буквы, которые составляют нынешний английский алфавит . Со времен средневековья это также те же буквы современного латинского алфавита . Порядок также важен для сортировки слов в алфавитном порядке .
Два набора содержат следующие 26 букв каждый: [1]
Набор прописных букв | А | Б | С | Д | И | Ф | Г | ЧАС | я | Дж | К | л | М | Н | ТО | П | вопрос | Р | С | Т | В | V | В | Х | И | С |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Набор строчных букв | а | б | с | д | и | ж | г | час | я | дж | к | л | м | н | тот | п | д | р | с | т | в | v | В | х | и | С |
История [ править ]
стало очевидно, К 1960-м годам в компьютерной и телекоммуникационной отраслях стран Первого мира что необходим непатентованный метод кодирования символов. Международная организация по стандартизации (ISO) инкапсулировала латинский алфавит в свой ( ISO/IEC 646 ) 7-битный стандарт кодирования символов. Чтобы добиться широкого признания, эта инкапсуляция была основана на популярном использовании. Стандарт был основан на уже опубликованном американском стандартном коде обмена информацией , более известном как ASCII , который включал в набор символов 26×2 буквы английского алфавита . Более поздние стандарты, выпущенные ISO, например ISO/IEC 8859 (8-битная кодировка символов) и ISO/IEC 10646 ( латинский Unicode ), продолжали определять буквы английского алфавита размером 26 × 2 как базовый латинский алфавит с расширениями. для обработки других букв на других языках. [1]
Терминология [ править ]
Блок Unicode , содержащий алфавит, называется « C0 Controls and Basic Latin ». Существуют два подзаголовка: [2]
- «Прописной латинский алфавит»: буквы начинаются с U + 0041 и в своих описаниях содержат строку ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА.
- «Строчный латинский алфавит»: буквы начинаются с U+0061 и в своих описаниях содержат строку LATIN SMALL LETTER.
есть еще два набора В блоке «Формы половинной и полной ширины» : [3]
- Прописные буквы: буквы начинаются с U+FF21 и в своих описаниях содержат строку ПОЛНАЯ ЛАТИНСКАЯ ЗАГЛАВНАЯ БУКВА.
- Нижний регистр: буквы начинаются с U+FF41 и в своих описаниях содержат строку FULLWIDTH LATIN SMALL LETTER.
стандартов кодирования Временная шкала
- 1865 г. Международный код Морзе был стандартизирован на Международном телеграфном конгрессе в Париже, а позже стал стандартом Международного союза электросвязи (ITU).
- 1950-х годов, Орфографический алфавит радиотелефонии разработанный ИКАО [4]
Хронология широко используемых компьютерных кодов алфавит поддерживающих ,
- 1963: ASCII (стандарт 7-битной кодировки символов Американской ассоциации стандартов , которая стала Американским национальным институтом стандартов ). в 1969 году
- 1963/1964: EBCDIC (разработан IBM и поддерживает те же буквенные символы, что и ASCII, но с другими значениями кода)
- 1965-04-30: Ратифицирован ECMA как ECMA-6. [5] на основе работы Технического комитета TC1 ECMA, проведенной с декабря 1960 года. [5]
- 1972: ISO 646 ( ISO стандарт 7-битной кодировки символов ISO/IEC ) , использующий те же значения буквенного кода, что и ASCII, пересмотренный во втором издании ISO 646:1983 и третьем издании ISO/IEC 646:1991 в качестве совместного стандарта
- 1983: Рек. МСЭ-Т. Т.51 | ISO/IEC 6937 (многобайтовое расширение ASCII)
- 1987: ISO/IEC 8859-1 :1987 (8-битная кодировка символов).
- Впоследствии были опубликованы другие версии и части ISO/IEC 8859.
- Середина-конец 1980-х: Windows-1250 , Windows-1252 и другие кодировки, используемые в Microsoft Windows (некоторые из них примерно похожи на ISO/IEC 8859-1).
- 1990: Unicode 1.0 (разработан Консорциумом Unicode ), [6] [7] содержится в блоке « C0 Controls and Basic Latin » с использованием тех же буквенных кодов, что и ASCII и ISO/IEC 646.
- Впоследствии были опубликованы другие версии Unicode, и позже он ISO/IEC , как указано ниже. также стал совместным стандартом
- 1993: ISO/IEC 10646-1 :1993, стандарт ISO/IEC для символов в Юникоде 1.1.
- Впоследствии были опубликованы другие версии ISO/IEC 10646-1 и одна версия ISO/IEC 10646-2. С 2003 года стандарты публикуются под названием «ISO/IEC 10646» без разделения на две части.
- 1997: Список глифов Windows 4
Представительство [ править ]
В ASCII буквы относятся к печатным символам , а в Юникоде, начиная с версии 1.0, они относятся к блоку « Элементы управления C0 и базовая латиница ». В обоих случаях, а также в ISO/IEC 646 , ISO/IEC 8859 и ISO/IEC 10646 они занимают позиции в шестнадцатеричной записи от 41 до 5A для верхнего регистра и от 61 до 7A для нижнего регистра.
Не чувствителен к регистру, все буквы имеют кодовые слова в орфографическом алфавите ИКАО и могут быть представлены азбукой Морзе .
Использование [ править ]
Все строчные буквы используются в Международном фонетическом алфавите (IPA). В X-SAMPA и SAMPA эти буквы имеют то же звуковое значение, что и в IPA.
Алфавиты, содержащие одинаковый набор букв [ править ]
В список ниже включены только алфавиты, в которых отсутствуют :
- буквы, диакритические знаки которых делают их отдельными буквами.
- мультиграфы , состоящие из отдельных букв.
- лигатуры , которые представляют собой отдельные буквы
Заметные упущения из-за этих правил включают испанский , эсперанто , филиппинский и немецкий языки . Иногда по традиции считается, что немецкий алфавит содержит только 26 букв (при этом ä, ö, ü считаются вариантами, а ß считается лигатурой), но текущие немецкие орфографические правила включают ä, ö, ü, ß в алфавите, расположенном после Z; однако этот порядок обычно не используется при сопоставлении: обычно ä, ö, ü сопоставляются как a, o, u (или иногда как ae, oe, ue), ß как ss.
Алфавит | Диакритический знак | Мультиграфы (не состоящие из отдельных букв) | Лигатуры |
---|---|---|---|
Африканский алфавит | á , ä , есть , есть , ê , е , í , î , ó , ô , ö , ú , û , ü ü , ý | Орграфы : ⟨ aa ⟩, ⟨ ai ⟩, ⟨ ch ⟩, ⟨ ee ⟩, ⟨ ⟩ , ⟨ eu ⟩, ⟨gh⟩, ⟨ ie ⟩, o ⟨ng⟩ o , ⟨ ei , ⟨ oo ⟩, ⟨ оу ⟩, ⟨sj⟩, ⟨tj⟩, ⟨ts⟩, ⟨ ui ⟩, ⟨ уу ⟩ Триграфы : ⟨aai⟩, ⟨eeu⟩, ⟨oei⟩, ⟨ooi⟩. | а (N-апостроф) |
Арагонский алфавит (орфография Academia de l'Aragonés) | á , é , í , ó , ú , ü , lꞏl | ⟨ ch ⟩, ⟨ гу ⟩, ⟨ ll ⟩, ⟨ ny ⟩, ⟨ qu ⟩, ⟨ rr ⟩, ⟨ tz ⟩ | |
Каталонский алфавит | à , é , è , í , ï , ó , ò , ú , ü , ç , lꞏl | ⟨ to ⟩, ⟨ ig ⟩, ⟨ ix ⟩, ⟨ ll ⟩, ⟨ ny ⟩, ⟨ qu ⟩, ⟨ rr ⟩, ⟨ ss ⟩ | |
Голландский алфавит | а , есть , есть , е , я , о , ü | Орграф ⟨ ⟩ ij иногда считается отдельной буквой. В этом случае он обычно заменяет или смешивается с ⟨y⟩. Другие орграфы: ⟨ aa ⟩, ⟨ ae ⟩, ⟨ ai ⟩, ⟨ au ⟩, ⟨ ch ⟩, ⟨ ee ⟩, ⟨ ei ⟩, ⟨ eu ⟩, ⟨ ie ⟩, ⟨ oe ⟩, ⟨ oi ⟩, ⟨ оо ⟩ , ⟨ оу ⟩, ⟨ ui ⟩, ⟨ ты ⟩ | |
английский алфавит | только в заимствованиях (см. ниже) 1 | ⟨ ш ⟩, ⟨ ч ⟩, ⟨ еа ⟩, ⟨ оу ⟩ , ⟨ й ⟩, ⟨ ф ⟩, ⟨ нг ⟩ | æ , œ (оба архаичные) |
Французский алфавит | à , â , ç , é , è , ê , ë , î , ï , ô , ù , û , ü , ÿ | ⟨ ai ⟩, ⟨ au ⟩, ⟨ ei ⟩, ⟨ eu ⟩, ⟨ oi ⟩, ⟨ или ⟩, ⟨ eau ⟨ ch ⟩ , am ph ⟩ , ⟨ g ⟩ , an ⟨ , ⟨ ⟩ , это ⟩, ⟨ эм ⟩ , , ⟨ в ⟩ on ⟨ и ⟩, ⟨ ⟩ ⟨ om ⟩, ⟨ un ⟨ um ⟩ , ⟩ yn ⟩ , , ym ⟩ , ai ⟨ , , ⟨ ⟩in ⟩ , on ⟨ ⟩ , ⟨ вкл ⟩, ⟨ вкл . ⟩ | æ (редко), œ (обязательно) |
Итальянский алфавит (расширенный) [а] | à , è , é , ì , î (формальный), ò , ó , ù | ⟨ch⟩ ch , ⟨ci⟩ , ⟨gh⟩ , ⟨gi⟩ , ⟨gl⟩ , ⟨gli⟩ , ⟨gn⟩ , ⟨sc⟩ , ⟨sci⟩ | |
Идо алфавит * | никто | ⟨ цюй ⟩, ⟨ ч ⟩, ⟨ ш ⟩ | |
Индонезийский алфавит | только в учебных материалах (см. ниже) 4 | ⟨ kh ⟩, ⟨ ng ⟩, ⟨ ny ⟩, ⟨ sy ⟩, дифтонги : ⟨ ai⟩ , ⟨au⟩, ⟨ei⟩, ⟨oi⟩ | |
Интерлингва алфавит * | только в неассимилированных заимствованиях (см. ниже) 2 | ⟨ ch ⟩, ⟨ ph ⟩, ⟨ qu ⟩, ⟨ rh ⟩, ⟨ sh ⟩ | |
Яванский латинский алфавит | это , это | ⟨ дх ⟩, ⟨ кх ⟩, ⟨ нг ⟩, ⟨ нью-й ⟩, ⟨ сы ⟩, ⟨ й ⟩ | |
Латинский алфавит без перегиба* | только дополнительный акцент для необычного стресса (см. ниже) 3 | ⟨ ae ⟩, ⟨ ch ⟩, ⟨ oe ⟩, ⟨ ph ⟩, ⟨ qu ⟩, ⟨ rh ⟩, ⟨ th ⟩ [8] | |
Люксембургский алфавит | ä , é , | ⟨ аа ⟩, ⟨ ch ⟩, ⟨ ck ⟩, ⟨ ⟩ , ⟨ ⟩ , ⟨ да ie ⟩, ⟨ ⟩ ⟨ ng , ⟨ oo ⟩ , ou ⟩, ei ⟨ да , ⟨ o ⟩, ⟨ сч ⟩ | |
Малайский алфавит | только в учебных материалах (см. ниже) 4 | ⟨ гх ⟩, ⟨ кх ⟩, ⟨ нг ⟩, ⟨ нй ⟩, ⟨ сы ⟩ | |
Португальский алфавит [б] | ã , õ , á , é , í , ó , ú , â , ê , ô , à , ç | ⟨ ч ⟩, ⟨ лч ⟩, ⟨ ⟨ рр нч ⟩, ⟨ сс ⟩, ⟩ , ⟨ им , ⟨ ⟩ утра ⟩ эм ⟩ , ⟨ ⟩, ⟨ ом ⟩, ⟨ а ⟩, ⟨ ãe ⟩ , ão , ⟨ õe ⟩ | |
Суданский латинский алфавит | и | ⟨ ЕС ⟩, ⟨ нг ⟩, ⟨ Нью-Йорк ⟩ |
* Созданные языки
- Английский — один из немногих современных европейских языков, не требующих диакритических знаков для родных слов (хотя диакритику некоторые американские издатели используют в таких словах, как « сотрудничество »). [с] [9]
- Интерлингва , искусственный язык, никогда не использует диакритические знаки, за исключением неассимилированных заимствованных слов. Однако их можно удалить, если они не используются для изменения гласной (например, cafe , от французского : cafe ). [10]
- Latino sine flexione , также известный как «Интерлингва Пеано», позволяет, но не требует размещения акцента для необычного ударения . (Он предшествует другому «Интерлингва» примерно на четыре десятилетия.)
- Малайский и индонезийский (основанный на малайском) — единственные языки за пределами Европы, в которых используется весь латинский алфавит и не требуются диакритические знаки и лигатуры. [д] Многие из более чем 700 языков Индонезии также используют индонезийский алфавит для написания своих языков: некоторые, например яванский, добавляют диакритические знаки é и è, а некоторые опускают q, x и z.
Нумерация столбцов [ править ]
Этот раздел нуждается в дополнительных цитатах для проверки . ( Октябрь 2023 г. ) |
Римский (латинский) алфавит обычно используется для нумерации столбцов в таблице или диаграмме. Это позволяет избежать путаницы с номерами строк, использующими арабские цифры . Например, таблица 3х3 будет содержать столбцы A, B и C, сопоставленные со строками 1, 2 и 3. Если необходимо больше столбцов, чем Z (обычно это последняя буква алфавита), столбец немедленно после Z идет AA, за ним следует AB и так далее (см. биективную систему с основанием 26 ). Это можно увидеть, прокрутив вправо в программе для работы с электронными таблицами, такой как Microsoft Excel или LibreOffice Calc .
Это двузначные «буквы» для столбцов таблицы, точно так же, как числа от 10 до 99 являются двузначными числами. Греческий алфавит имеет аналогичную расширенную форму, в которой при необходимости используются такие двузначные буквы, но он используется для глав братства, а не для столбцов таблицы.
Такими двузначными буквами для пунктов списка являются AA, BB, CC и т. д., в отличие от числовой системы разрядов, описанной выше для столбцов таблицы.
См. также [ править ]
- Еврейский алфавит
- Греческий алфавит
- Латинский алфавит
- Латинский алфавит для звукового соответствия.
- Список алфавитов латинского алфавита
- Ранняя кириллица , Кириллические алфавиты
- Кодовые страницы Windows
Примечания [ править ]
- ^ Традиционно считается, что итальянский алфавит состоит только из 21 буквы, не считая j , k , w , x , y . Однако на практике эти буквы встречаются во многих заимствованных словах. J также встречается в некоторых коренных итальянских именах собственных как вариант полугласного написания i .
- ^ Примечание для португальского языка: k и y (но не w ) были частью алфавита до нескольких реформ орфографии в 20 веке, целью которых было изменить этимологическое португальское написание на более простое фонетическое написание. Эти буквы были заменены другими буквами, имеющими то же звучание: так Psychologia стала psicologia , kioske стала quiosque , martyr стала mártir и т. д. В настоящее время k , w и y встречаются только в иностранных словах и производных от них терминах, а также в научных сокращениях (например, k, w и y). км , байронизм ). Эти буквы снова считаются частью алфавита после Орфографического соглашения португальского языка 1990 года , которое вступило в силу 1 января 2009 года в Бразилии. См. Реформы португальской орфографии .
- ^ Пример статьи, содержащей диарезис в слове «сотрудничать», а также акценты на заимствованных словах в английском языке, таких как седиль в слове «фасады» и циркумфлекс в слове «креп», см. Графтон, Энтони (23 октября 2006 г.). «Книги: Чокнутые профессора, История академической харизмы» . Житель Нью-Йорка .
- ^ Однако в учебных материалах на малайском и индонезийском языках может использоваться ⟨é⟩ (E с акутом) для уточнения произношения буквы E; в этом случае ⟨e⟩ произносится /ə/, тогда как ⟨é⟩ произносится /e/, а (è) произносится /ɛ/.
Ссылки [ править ]
- ↑ Перейти обратно: Перейти обратно: а б с «Международная стандартизация 7-битных кодов, ISO 646» . Трансъевропейская ассоциация исследовательских и образовательных сетей (TERENA) . Проверено 3 октября 2010 г.
- ^ «Элементы управления C0 и базовая латиница» (PDF) . Юникод.орг . Проверено 8 августа 2016 г.
- ^ «Формы половинной и полной ширины» (PDF) . Юникод.орг . Проверено 8 августа 2016 г.
- ^ «История почты ИКАО» . www.icao.int . Архивировано из оригинала 12 февраля 2019 года . Проверено 17 февраля 2019 г.
- ↑ Перейти обратно: Перейти обратно: а б Стандарт ECMA-6: 7-битный набор кодированных символов (PDF) (5-е изд.). Женева, Швейцария: Европейская ассоциация производителей компьютеров (Ecma). Март 1985 г. Архивировано из оригинала (PDF) 29 мая 2016 г. . Проверено 29 мая 2016 г.
Технический комитет TC1 ECMA впервые собрался в декабре 1960 года для подготовки стандартных кодов для целей ввода/вывода. 30 апреля 1965 года стандарт ECMA-6 был принят Генеральной ассамблеей ECMA.
- ^ «База данных символов Юникода» . Стандарт Юникод . Проверено 22 марта 2013 г.
- ^ Стандарт Unicode, версия 1.0, том 1 . Addison-Wesley Publishing Company, Inc., 1990. ISBN. 0-201-56788-1 .
- ^ Не «буквы», согласно: Агер, Саймон . «Латиноамериканское сгибание» . Омниглот . Латиноамериканский алфавит sine Flexione . Проверено 14 апреля 2023 г.
- ^ «Странная примета жителя Нью-Йорка — диарезис» . 16 декабря 2010 г. Архивировано из оригинала 16 декабря 2010 г.
- ^ «Введение в СВУ (на английском языке)» . www.interlingua.com . Проверено 21 сентября 2020 г.