Jump to content

Самые распространенные слова на испанском языке

Ниже приведены две оценки наиболее распространенных слов в современном испанском языке . Каждая оценка основана на анализе отдельного корпуса текстов . Текстовый корпус — это большая коллекция образцов письменной и/или устной речи, тщательно подготовленная для лингвистического анализа. Чтобы определить, какие слова являются наиболее распространенными, исследователи создают базу данных всех слов, встречающихся в корпусе, и классифицируют их в зависимости от контекста, в котором они используются.

В первой таблице перечислены 100 наиболее распространенных словоформ из Corpus de Referencia del Español Actual (CREA), текстового корпуса, составленного Real Academia Española (RAE). RAE — официальное учреждение Испании по документированию, планированию и стандартизации испанского языка. Словоформа это любой из грамматических вариантов слова.

Вторая таблица представляет собой список из 100 наиболее распространенных лемм, найденных в корпусе текстов, составленном Марком Дэвисом и другими исследователями языка из Университета Бригама Янга в США. Лемма . — это основная форма слова, которая встречается в словаре Испанский инфинитив tener («иметь») — это лемма, а tiene («имеет») — спряжение слова tener это словоформа.

Королевская испанская академия

[ редактировать ]

Приведенный ниже список взят из «1000 formas más frecuentes» ( перевод «1000 наиболее частых словоформ »)», списка, опубликованного Real Academia Española (RAE) на основе анализа более 160 миллионов словоформ, найденных в Corpus de Referencia del Español. Актуальный ( в переводе Reference Corpus of Current Spanish ), или CREA, представляет собой компьютеризированный корпус текстов, написанных на испанском языке, и транскриптов разговорного испанского языка. Он включает в себя книги, журналы и газеты самого разнообразного содержания, а также. стенограммы разговорной речи из радио- и телепередач и других источников. Все произведения в сборнике относятся к периоду с 1975 по 2004 год. CREA включает образцы из всех испаноязычных стран. [1]

Список «2000 наиболее частых словоформ» получен на основе анализа CREA версии 3.2. [2] Множественное число , спряжения глаголов и другие флексии оцениваются отдельно. Однако омонимы не отличаются друг от друга. CREA 3.2 был опубликован в июне 2008 года. [1]

Наиболее часто встречающиеся словоформы из примерно 160 миллионов слов.
(РАЭ 2008)
Классифицировать Словоформа События Часть речи Перевод
1 из 9,999,518 предлог из; от
2 тот 6,277,560 артикль , местоимение ; Местоимение третьего лица женского рода единственного числа
3 что 4,681,839 соединение то, что
4 он 4,569,652 статья тот
5 в 4,234,281 предлог в, на
6 и 4,180,279 соединение и
7 а 3,260,939 предлог чтобы, в
8 тот 2,618,657 артикль, местоимение ; Прямой объект мужского рода от третьего лица
9 с 2,022,514 местоимение -сам, себя ( рефлексивный )
10 принадлежащий 1,857,225 предлог из
11 тот 1,686,741 артикль, местоимение ; прямой объект женского рода от третьего лица
12 и 1,659,827 статья а, и
13 к 1,561,904 предлог через, ради, через
14 с 1,481,607 предлог с
15 нет 1,465,503 наречие нет; нет
16 а 1,347,603 статья а, ан, один
17 являются 1,103,617 притяжательный его/ее/его/ваш
18 к 1,062,152 предлог для того, чтобы, чтобы
19 является 1,019,669 глагол является
20 аль 951,054 предлог к
21 это 866,955 артикль, местоимение ; Прямой объект мужского рода от третьего лица
22 как 773,465 соединение типа как
23 дальше 661,696 прилагательное более
24 тот 542,284 соединение или
25 но 450,512 соединение но
26 их 449,870 притяжательный его/ее/его/ваш
27 тот 413,241 местоимение Косвенный объект от третьего лица
28 ха 380,339 глагол он/она/оно [сделало что-то]; вы (формально) [сделали что-то]
29 мне 374,368 местоимение мне
30 и 327,480 соединение если, ли
31 грех 298,383 предлог без
32 на 289,704 предлог поверх, над, около
33 это 285,461 прилагательное этот
34 из 274,177 наречие уже; все еще
35 между 267,493 предлог между
36 когда 257,272 соединение когда
37 все 247,340 прилагательное все, каждый
38 этот 238,841 прилагательное этот
39 быть 232,924 глагол быть
40 сын 232,415 глагол они, вы ( мн. )
41 принадлежащий 228,439 число два
42 также 227,411 наречие тоже, также, также
43 был 223,791 глагол был
44 там было 223,430 глагол Я/он/она/оно/был (или был)
45 эпоха 219,933 глагол был
46 очень 208,540 наречие очень
47 годы 203,027 существительное
(мужской род)
годы
48 до 202,935 предлог до
49 от 198,647 предлог от; с
50 этот 194,168 глагол является
51 мне 186,360 притяжательный мой
52 почему 185,700 соединение потому что
53 что 184,956 местоимение что?; который?; как прилагательное
54 только 170,552 наречие только, исключительно
55 он 169,718 глагол они/вы (мн.) [сделали что-то]
56 они 167,684 местоимение я
57 хороший 164,940 глагол есть/есть
58 время 163,538 существительное
(женский)
время, экземпляр
59 может 161,219 глагол может
60 все 158,168 прилагательное все; каждый
61 Так 155,645 наречие вот так
62 нас 154,412 местоимение нас
63 в 153,451 союз, наречие ни один; ни; нет даже
64 часть 148,750 существительное
(мужской/женский)
часть; сообщение
65 имеет 147,274 глагол имеет
66 он 139,080 местоимение
(мужской род)
он, оно
67 а 136,020 число один
68 где 132,077 предлог где
69 ХОРОШИЙ 130,957 прилагательное хорошо, ну
70 время 130,896 существительное
(мужской род)
время; погода
71 такой же 130,746 прилагательное такой же
72 что 127,976 местоимение что
73 сейчас 125,661 наречие сейчас
74 каждый 124,558 определитель каждый; каждый
75 и 123,729 соединение и
76 жизнь 123,491 существительное
(женский)
жизнь
77 другой 121,983 прилагательное другой, другой
78 после 121,746 предлог после
79 тот 120,052 местоимение тебе, для тебя; сам
80 другие 119,500 местоимение другие
81 хотя 115,556 соединение хотя, хотя, хотя
82 что 115,377 прилагательное что
83 что 114,523 местоимение что
84 делает 114,507 глагол он/она/оно делает/делает
85 другой 113,982 прилагательное, местоимение другой; другой
86 правительство 113,011 существительное
(мужской род)
правительство
87 загар 112,471 наречие так
88 в течение 112,020 предлог в течение
89 всегда 111,557 наречие всегда
90 день 110,921 существительное
(мужской род)
день
91 оба 110,679 прилагательное, наречие так много
92 она 110,620 местоимение она, она; это
93 три 109,542 число три
94 Ага 108,631 существительное, местоимение да, если; возвратное местоимение
95 сказал 108,471 глагол сказал; сказал
96 был 107,352 причастие прошедшего времени был
97 большой 106,991 прилагательное большой, большой, большой
98 страна 104,568 существительное
(мужской род)
страна
99 в соответствии с 104,204 предлог как; в соответствии с
100 меньше 103,498 прилагательное меньше; меньше

Марк Дэвис

[ редактировать ]

В 2006 году Марк Дэвис , доцент кафедры лингвистики Университета Бригама Янга , опубликовал свою оценку 5000 наиболее распространенных слов в современном испанском языке. Чтобы составить этот список, он собрал образцы только из источников 20-го века, особенно с 1970 по 2000 годы. Большинство источников относятся к 1990-м годам. Из 20 миллионов слов в корпусе около трети (~6 750 000 слов) взяты из расшифровок разговорного испанского языка: разговоров, интервью, лекций, проповедей, пресс-конференций, спортивных трансляций и так далее. Среди письменных источников — романы, пьесы, рассказы, письма, эссе, газеты, энциклопедия « Энкарта» . Образцы, письменные и устные, получены из Испании и как минимум 10 стран Латинской Америки. Большинство образцов ранее были собраны для Corpus del Español (2001), корпуса объемом 100 миллионов слов, включающего произведения с 13 по 20 век. [3] [4]

5000 слов в списке Дэвиса — это леммы . [5] Лемма — это форма слова, как оно появляется в словаре. [6] Например, существительные в единственном и множественном числе рассматриваются как одно и то же слово, равно как и инфинитивы и спряжения глаголов. В таблице ниже представлены 100 лучших слов из списка Дэвиса, состоящего из 5000 слов. [7] [8] В этом списке проводится различие между определенными артиклями lo и la и местоимениями lo и la ; все оцениваются индивидуально. Прилагательные ese и esa ранжируются вместе (как и este и esta ), но местоимение eso стоит отдельно. Все спряжения глагола ранжируются вместе.

Выделенная строка указывает на то, что это слово особенно часто встречается в образцах разговорного испанского языка. [9]

Самые частые леммы из ~20 миллионов слов
(Дэвис, 2006 г.)
Классифицировать Лемма События Часть речи Перевод
1 el / она 2,037,803 статья тот
2 из 1,319,834 предлог из, из
3 что 662,653 соединение то, что
4 и 562,162 соединение и
5 а 529,899 предлог чтобы, в
6 в 507,233 предлог в, на
7 и 434,022 статья а, и
8 быть 374,194 глагол быть
9 с 329,012 местоимение -сам, себя (рефлексивный)
10 нет 257,365 наречие нет
11 иметь 196,962 глагол иметь
12 к 190,975 предлог через, ради, через
13 с 184,597 предлог с
14 являются 187,810 прилагательное его, ее, их, твой
15 к 126,061 предлог для того, чтобы, чтобы
16 как 106,840 соединение типа как
17 быть 106,429 глагол быть
18 иметь 106,642 глагол иметь
19 тот 98,211 местоимение Косвенный объект от третьего лица
20 это 91,035 статья тот
21 это 92,519 местоимение Прямой объект мужского рода от третьего лица
22 все 88,057 прилагательное все, каждый
23 но 82,435 соединение но, все же, за исключением
24 дальше 92,352 прилагательное более
25 делать 81,619 глагол делать; сделать
26 тот 82,444 соединение или
27 может 76,738 глагол иметь возможность, может
28 сказать 79,343 глагол рассказать, сказать
29 это / это 80,544 прилагательное этот
30 и 70,352 глагол идти
31 другой 61,726 прилагательное другой, другой
32 тот самый 60,989 прилагательное что
33 тот 55,523 местоимение прямой объект женского рода от третьего лица
34 и 53,608 соединение если, ли
35 мне 95,577 местоимение мне
36 из 46,778 наречие уже, еще
37 видеть 45,854 глагол чтобы увидеть
38 почему 44,500 соединение потому что
39 но 40,233 глагол дать
40 когда 39,726 соединение когда
41 он 38,597 местоимение он
42 очень 39,558 наречие очень, правда
43 грех 40,432 предлог без
44 время 35,286 существительное
(женский)
время, явление
45 много 36,391 прилагательное много, много, много
46 знать 37,092 глагол знать
47 что 42,000 местоимение что?; который?; как прилагательное
48 на 35,038 предлог поверх, над, около
49 мне 45,636 прилагательное мой
50 некоторый 30,485 прилагательное / местоимение некоторый; кто-то
51 такой же 29,569 прилагательное такой же
52 они 54,635 местоимение я
53 также 33,348 наречие также
54 до 29,506 предлог / наречие до тех пор, пока; до; даже
55 год 33,053 существительное
(мужской род)
год
56 принадлежащий 27,733 число два
57 хотеть 28,696 глагол хотеть, любить
58 между 30,756 предлог между
59 Так 24,832 наречие вот так
60 первый 26,553 прилагательное первый
61 от 25,288 предлог от, поскольку
62 большой 25,963 прилагательное большой, большой, большой
63 что 31,636 местоимение
(средний род)
что
64 в 24,261 соединение ни даже, ни, ни
65 нас 26,349 местоимение нас
66 приезжать 22,878 глагол прибыть
67 рынок 22,466 глагол пройти; произойти; проводить время
68 время 22,432 существительное
(мужской род)
время, погода
69 они s) 24,770 местоимение она; (множественное число) их
70 Ага 33,828 наречие да
71 день 24,715 существительное
(мужской род)
день
72 а 21,407 число один
73 ХОРОШИЙ 21,589 наречие хорошо
74 кусочек 20,986 прилагательное / наречие мало, мало; немного
75 долг 22,232 глагол должен, должен; быть должен
76 так 23,548 наречие итак, тогда
77 помещать 20,330 глагол надеть (на); получить [прилагательное]
78 Что 23,943 существительное
(женский)
вещь
79 оба 20,531 прилагательное много
80 мужчина 20,292 существительное
(мужской род)
мужчина, человечество, муж
81 мнение 19,964 глагол казаться, выглядеть
82 наш 20,666 прилагательное наш
83 загар 19,002 наречие такой, тоже такой
84 где 18,852 соединение где
85 сейчас 21,030 наречие сейчас
86 часть 20,319 существительное
(женский)
часть, порция
87 после 20,229 наречие после
88 жизнь 18,045 существительное
(женский)
жизнь
89 встретиться 18,152 глагол остаться, остаться
90 всегда 17,689 наречие всегда
91 полагать 21,257 глагол верить
92 разговаривать 19,006 глагол говорить, говорить
93 нести 17,062 глагол брать, нести
94 оставлять 18,185 глагол позволить, оставить
95 ничего 19,365 местоимение ничего
96 каждый 17,155 прилагательное каждый, каждый
97 следовать 16,104 глагол следовать
98 меньше 15,527 прилагательное меньше, меньше
99 новый 17,381 прилагательное новый
100 находить 15,556 глагол найти

См. также

[ редактировать ]

Примечания

[ редактировать ]
  1. ^ Jump up to: а б «КРЕА» . RAE.es (на испанском языке). Реал Академия Испании . Проверено 13 июля 2017 г.
  2. ^ «Справочный корпус текущего испанского языка (CREA) — Список частот» . RAE.es (на испанском языке). Королевская испанская академия . Проверено 13 июля 2017 г.
  3. ^ Дэвис (2006), с. 2–3
  4. ^ «Корпус испанского языка» . corpusdelespanol.org . Проверено 13 июля 2017 г.
  5. ^ Дэвис (2006), стр. 4–6.
  6. ^ Дэвис (2006), с. 4
  7. ^ Дэвис (2006), стр. 12–14.
  8. ^ «Лучший испанский словарь» . Vistawide Мировые языки и культуры . Проверено 13 июля 2017 г.
  9. ^ Дэвис (2006), с. 9
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: 0da6a170eb4ebe872e45cdf329afb89d__1717006500
URL1:https://arc.ask3.ru/arc/aa/0d/9d/0da6a170eb4ebe872e45cdf329afb89d.html
Заголовок, (Title) документа по адресу, URL1:
Most common words in Spanish - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)