Самые распространенные слова на испанском языке
Ниже приведены две оценки наиболее распространенных слов в современном испанском языке . Каждая оценка основана на анализе отдельного корпуса текстов . Текстовый корпус — это большая коллекция образцов письменной и/или устной речи, тщательно подготовленная для лингвистического анализа. Чтобы определить, какие слова являются наиболее распространенными, исследователи создают базу данных всех слов, встречающихся в корпусе, и классифицируют их в зависимости от контекста, в котором они используются.
В первой таблице перечислены 100 наиболее распространенных словоформ из Corpus de Referencia del Español Actual (CREA), текстового корпуса, составленного Real Academia Española (RAE). RAE — официальное учреждение Испании по документированию, планированию и стандартизации испанского языка. Словоформа – это любой из грамматических вариантов слова.
Вторая таблица представляет собой список из 100 наиболее распространенных лемм, найденных в корпусе текстов, составленном Марком Дэвисом и другими исследователями языка из Университета Бригама Янга в США. Лемма . — это основная форма слова, которая встречается в словаре Испанский инфинитив tener («иметь») — это лемма, а tiene («имеет») — спряжение слова tener — это словоформа.
Королевская испанская академия
[ редактировать ]Приведенный ниже список взят из «1000 formas más frecuentes» ( перевод «1000 наиболее частых словоформ »)», списка, опубликованного Real Academia Española (RAE) на основе анализа более 160 миллионов словоформ, найденных в Corpus de Referencia del Español. Актуальный ( в переводе Reference Corpus of Current Spanish ), или CREA, представляет собой компьютеризированный корпус текстов, написанных на испанском языке, и транскриптов разговорного испанского языка. Он включает в себя книги, журналы и газеты самого разнообразного содержания, а также. стенограммы разговорной речи из радио- и телепередач и других источников. Все произведения в сборнике относятся к периоду с 1975 по 2004 год. CREA включает образцы из всех испаноязычных стран. [1]
Список «2000 наиболее частых словоформ» получен на основе анализа CREA версии 3.2. [2] Множественное число , спряжения глаголов и другие флексии оцениваются отдельно. Однако омонимы не отличаются друг от друга. CREA 3.2 был опубликован в июне 2008 года. [1]
Классифицировать | Словоформа | События | Часть речи | Перевод |
---|---|---|---|---|
1 | из | 9,999,518 | предлог | из; от |
2 | тот | 6,277,560 | артикль , местоимение | ; Местоимение третьего лица женского рода единственного числа |
3 | что | 4,681,839 | соединение | то, что |
4 | он | 4,569,652 | статья | тот |
5 | в | 4,234,281 | предлог | в, на |
6 | и | 4,180,279 | соединение | и |
7 | а | 3,260,939 | предлог | чтобы, в |
8 | тот | 2,618,657 | артикль, местоимение | ; Прямой объект мужского рода от третьего лица |
9 | с | 2,022,514 | местоимение | -сам, себя ( рефлексивный ) |
10 | принадлежащий | 1,857,225 | предлог | из |
11 | тот | 1,686,741 | артикль, местоимение | ; прямой объект женского рода от третьего лица |
12 | и | 1,659,827 | статья | а, и |
13 | к | 1,561,904 | предлог | через, ради, через |
14 | с | 1,481,607 | предлог | с |
15 | нет | 1,465,503 | наречие | нет; нет |
16 | а | 1,347,603 | статья | а, ан, один |
17 | являются | 1,103,617 | притяжательный | его/ее/его/ваш |
18 | к | 1,062,152 | предлог | для того, чтобы, чтобы |
19 | является | 1,019,669 | глагол | является |
20 | аль | 951,054 | предлог | к |
21 | это | 866,955 | артикль, местоимение | ; Прямой объект мужского рода от третьего лица |
22 | как | 773,465 | соединение | типа как |
23 | дальше | 661,696 | прилагательное | более |
24 | тот | 542,284 | соединение | или |
25 | но | 450,512 | соединение | но |
26 | их | 449,870 | притяжательный | его/ее/его/ваш |
27 | тот | 413,241 | местоимение | Косвенный объект от третьего лица |
28 | ха | 380,339 | глагол | он/она/оно [сделало что-то]; вы (формально) [сделали что-то] |
29 | мне | 374,368 | местоимение | мне |
30 | и | 327,480 | соединение | если, ли |
31 | грех | 298,383 | предлог | без |
32 | на | 289,704 | предлог | поверх, над, около |
33 | это | 285,461 | прилагательное | этот |
34 | из | 274,177 | наречие | уже; все еще |
35 | между | 267,493 | предлог | между |
36 | когда | 257,272 | соединение | когда |
37 | все | 247,340 | прилагательное | все, каждый |
38 | этот | 238,841 | прилагательное | этот |
39 | быть | 232,924 | глагол | быть |
40 | сын | 232,415 | глагол | они, вы ( мн. ) |
41 | принадлежащий | 228,439 | число | два |
42 | также | 227,411 | наречие | тоже, также, также |
43 | был | 223,791 | глагол | был |
44 | там было | 223,430 | глагол | Я/он/она/оно/был (или был) |
45 | эпоха | 219,933 | глагол | был |
46 | очень | 208,540 | наречие | очень |
47 | годы | 203,027 | существительное (мужской род) | годы |
48 | до | 202,935 | предлог | до |
49 | от | 198,647 | предлог | от; с |
50 | этот | 194,168 | глагол | является |
51 | мне | 186,360 | притяжательный | мой |
52 | почему | 185,700 | соединение | потому что |
53 | что | 184,956 | местоимение | что?; который?; как прилагательное |
54 | только | 170,552 | наречие | только, исключительно |
55 | он | 169,718 | глагол | они/вы (мн.) [сделали что-то] |
56 | они | 167,684 | местоимение | я |
57 | хороший | 164,940 | глагол | есть/есть |
58 | время | 163,538 | существительное (женский) | время, экземпляр |
59 | может | 161,219 | глагол | может |
60 | все | 158,168 | прилагательное | все; каждый |
61 | Так | 155,645 | наречие | вот так |
62 | нас | 154,412 | местоимение | нас |
63 | в | 153,451 | союз, наречие | ни один; ни; нет даже |
64 | часть | 148,750 | существительное (мужской/женский) | часть; сообщение |
65 | имеет | 147,274 | глагол | имеет |
66 | он | 139,080 | местоимение (мужской род) | он, оно |
67 | а | 136,020 | число | один |
68 | где | 132,077 | предлог | где |
69 | ХОРОШИЙ | 130,957 | прилагательное | хорошо, ну |
70 | время | 130,896 | существительное (мужской род) | время; погода |
71 | такой же | 130,746 | прилагательное | такой же |
72 | что | 127,976 | местоимение | что |
73 | сейчас | 125,661 | наречие | сейчас |
74 | каждый | 124,558 | определитель | каждый; каждый |
75 | и | 123,729 | соединение | и |
76 | жизнь | 123,491 | существительное (женский) | жизнь |
77 | другой | 121,983 | прилагательное | другой, другой |
78 | после | 121,746 | предлог | после |
79 | тот | 120,052 | местоимение | тебе, для тебя; сам |
80 | другие | 119,500 | местоимение | другие |
81 | хотя | 115,556 | соединение | хотя, хотя, хотя |
82 | что | 115,377 | прилагательное | что |
83 | что | 114,523 | местоимение | что |
84 | делает | 114,507 | глагол | он/она/оно делает/делает |
85 | другой | 113,982 | прилагательное, местоимение | другой; другой |
86 | правительство | 113,011 | существительное (мужской род) | правительство |
87 | загар | 112,471 | наречие | так |
88 | в течение | 112,020 | предлог | в течение |
89 | всегда | 111,557 | наречие | всегда |
90 | день | 110,921 | существительное (мужской род) | день |
91 | оба | 110,679 | прилагательное, наречие | так много |
92 | она | 110,620 | местоимение | она, она; это |
93 | три | 109,542 | число | три |
94 | Ага | 108,631 | существительное, местоимение | да, если; возвратное местоимение |
95 | сказал | 108,471 | глагол | сказал; сказал |
96 | был | 107,352 | причастие прошедшего времени | был |
97 | большой | 106,991 | прилагательное | большой, большой, большой |
98 | страна | 104,568 | существительное (мужской род) | страна |
99 | в соответствии с | 104,204 | предлог | как; в соответствии с |
100 | меньше | 103,498 | прилагательное | меньше; меньше |
Марк Дэвис
[ редактировать ]В 2006 году Марк Дэвис , доцент кафедры лингвистики Университета Бригама Янга , опубликовал свою оценку 5000 наиболее распространенных слов в современном испанском языке. Чтобы составить этот список, он собрал образцы только из источников 20-го века, особенно с 1970 по 2000 годы. Большинство источников относятся к 1990-м годам. Из 20 миллионов слов в корпусе около трети (~6 750 000 слов) взяты из расшифровок разговорного испанского языка: разговоров, интервью, лекций, проповедей, пресс-конференций, спортивных трансляций и так далее. Среди письменных источников — романы, пьесы, рассказы, письма, эссе, газеты, энциклопедия « Энкарта» . Образцы, письменные и устные, получены из Испании и как минимум 10 стран Латинской Америки. Большинство образцов ранее были собраны для Corpus del Español (2001), корпуса объемом 100 миллионов слов, включающего произведения с 13 по 20 век. [3] [4]
5000 слов в списке Дэвиса — это леммы . [5] Лемма — это форма слова, как оно появляется в словаре. [6] Например, существительные в единственном и множественном числе рассматриваются как одно и то же слово, равно как и инфинитивы и спряжения глаголов. В таблице ниже представлены 100 лучших слов из списка Дэвиса, состоящего из 5000 слов. [7] [8] В этом списке проводится различие между определенными артиклями lo и la и местоимениями lo и la ; все оцениваются индивидуально. Прилагательные ese и esa ранжируются вместе (как и este и esta ), но местоимение eso стоит отдельно. Все спряжения глагола ранжируются вместе.
Выделенная строка указывает на то, что это слово особенно часто встречается в образцах разговорного испанского языка. [9]
Классифицировать | Лемма | События | Часть речи | Перевод |
---|---|---|---|---|
1 | el / она | 2,037,803 | статья | тот |
2 | из | 1,319,834 | предлог | из, из |
3 | что | 662,653 | соединение | то, что |
4 | и | 562,162 | соединение | и |
5 | а | 529,899 | предлог | чтобы, в |
6 | в | 507,233 | предлог | в, на |
7 | и | 434,022 | статья | а, и |
8 | быть | 374,194 | глагол | быть |
9 | с | 329,012 | местоимение | -сам, себя (рефлексивный) |
10 | нет | 257,365 | наречие | нет |
11 | иметь | 196,962 | глагол | иметь |
12 | к | 190,975 | предлог | через, ради, через |
13 | с | 184,597 | предлог | с |
14 | являются | 187,810 | прилагательное | его, ее, их, твой |
15 | к | 126,061 | предлог | для того, чтобы, чтобы |
16 | как | 106,840 | соединение | типа как |
17 | быть | 106,429 | глагол | быть |
18 | иметь | 106,642 | глагол | иметь |
19 | тот | 98,211 | местоимение | Косвенный объект от третьего лица |
20 | это | 91,035 | статья | тот |
21 | это | 92,519 | местоимение | Прямой объект мужского рода от третьего лица |
22 | все | 88,057 | прилагательное | все, каждый |
23 | но | 82,435 | соединение | но, все же, за исключением |
24 | дальше | 92,352 | прилагательное | более |
25 | делать | 81,619 | глагол | делать; сделать |
26 | тот | 82,444 | соединение | или |
27 | может | 76,738 | глагол | иметь возможность, может |
28 | сказать | 79,343 | глагол | рассказать, сказать |
29 | это / это | 80,544 | прилагательное | этот |
30 | и | 70,352 | глагол | идти |
31 | другой | 61,726 | прилагательное | другой, другой |
32 | тот самый | 60,989 | прилагательное | что |
33 | тот | 55,523 | местоимение | прямой объект женского рода от третьего лица |
34 | и | 53,608 | соединение | если, ли |
35 | мне | 95,577 | местоимение | мне |
36 | из | 46,778 | наречие | уже, еще |
37 | видеть | 45,854 | глагол | чтобы увидеть |
38 | почему | 44,500 | соединение | потому что |
39 | но | 40,233 | глагол | дать |
40 | когда | 39,726 | соединение | когда |
41 | он | 38,597 | местоимение | он |
42 | очень | 39,558 | наречие | очень, правда |
43 | грех | 40,432 | предлог | без |
44 | время | 35,286 | существительное (женский) | время, явление |
45 | много | 36,391 | прилагательное | много, много, много |
46 | знать | 37,092 | глагол | знать |
47 | что | 42,000 | местоимение | что?; который?; как прилагательное |
48 | на | 35,038 | предлог | поверх, над, около |
49 | мне | 45,636 | прилагательное | мой |
50 | некоторый | 30,485 | прилагательное / местоимение | некоторый; кто-то |
51 | такой же | 29,569 | прилагательное | такой же |
52 | они | 54,635 | местоимение | я |
53 | также | 33,348 | наречие | также |
54 | до | 29,506 | предлог / наречие | до тех пор, пока; до; даже |
55 | год | 33,053 | существительное (мужской род) | год |
56 | принадлежащий | 27,733 | число | два |
57 | хотеть | 28,696 | глагол | хотеть, любить |
58 | между | 30,756 | предлог | между |
59 | Так | 24,832 | наречие | вот так |
60 | первый | 26,553 | прилагательное | первый |
61 | от | 25,288 | предлог | от, поскольку |
62 | большой | 25,963 | прилагательное | большой, большой, большой |
63 | что | 31,636 | местоимение (средний род) | что |
64 | в | 24,261 | соединение | ни даже, ни, ни |
65 | нас | 26,349 | местоимение | нас |
66 | приезжать | 22,878 | глагол | прибыть |
67 | рынок | 22,466 | глагол | пройти; произойти; проводить время |
68 | время | 22,432 | существительное (мужской род) | время, погода |
69 | они s) | 24,770 | местоимение | она; (множественное число) их |
70 | Ага | 33,828 | наречие | да |
71 | день | 24,715 | существительное (мужской род) | день |
72 | а | 21,407 | число | один |
73 | ХОРОШИЙ | 21,589 | наречие | хорошо |
74 | кусочек | 20,986 | прилагательное / наречие | мало, мало; немного |
75 | долг | 22,232 | глагол | должен, должен; быть должен |
76 | так | 23,548 | наречие | итак, тогда |
77 | помещать | 20,330 | глагол | надеть (на); получить [прилагательное] |
78 | Что | 23,943 | существительное (женский) | вещь |
79 | оба | 20,531 | прилагательное | много |
80 | мужчина | 20,292 | существительное (мужской род) | мужчина, человечество, муж |
81 | мнение | 19,964 | глагол | казаться, выглядеть |
82 | наш | 20,666 | прилагательное | наш |
83 | загар | 19,002 | наречие | такой, тоже такой |
84 | где | 18,852 | соединение | где |
85 | сейчас | 21,030 | наречие | сейчас |
86 | часть | 20,319 | существительное (женский) | часть, порция |
87 | после | 20,229 | наречие | после |
88 | жизнь | 18,045 | существительное (женский) | жизнь |
89 | встретиться | 18,152 | глагол | остаться, остаться |
90 | всегда | 17,689 | наречие | всегда |
91 | полагать | 21,257 | глагол | верить |
92 | разговаривать | 19,006 | глагол | говорить, говорить |
93 | нести | 17,062 | глагол | брать, нести |
94 | оставлять | 18,185 | глагол | позволить, оставить |
95 | ничего | 19,365 | местоимение | ничего |
96 | каждый | 17,155 | прилагательное | каждый, каждый |
97 | следовать | 16,104 | глагол | следовать |
98 | меньше | 15,527 | прилагательное | меньше, меньше |
99 | новый | 17,381 | прилагательное | новый |
100 | находить | 15,556 | глагол | найти |
См. также
[ редактировать ]Примечания
[ редактировать ]- ^ Jump up to: а б «КРЕА» . RAE.es (на испанском языке). Реал Академия Испании . Проверено 13 июля 2017 г.
- ^ «Справочный корпус текущего испанского языка (CREA) — Список частот» . RAE.es (на испанском языке). Королевская испанская академия . Проверено 13 июля 2017 г.
- ^ Дэвис (2006), с. 2–3
- ^ «Корпус испанского языка» . corpusdelespanol.org . Проверено 13 июля 2017 г.
- ^ Дэвис (2006), стр. 4–6.
- ^ Дэвис (2006), с. 4
- ^ Дэвис (2006), стр. 12–14.
- ^ «Лучший испанский словарь» . Vistawide Мировые языки и культуры . Проверено 13 июля 2017 г.
- ^ Дэвис (2006), с. 9
Ссылки
[ редактировать ]- Дэвис, Марк (2006). Частотный словарь испанского языка: основной словарный запас для учащихся . Рутледж . OCLC 300359892 .
Внешние ссылки
[ редактировать ]- Карделлино, Кристиан (март 2016 г.). «Корпус и вложения испанских миллиардов слов» . crscardellino.github.io . Кристиан Карделлино.