Jump to content

Словесный эскиз

Словесный набросок глагола «читать» в Британском национальном корпусе в Sketch Engine

Набросок слова — это одностраничное автоматическое сводное описание грамматического и коллокационного поведения слова, полученное из корпуса. Словесные эскизы были впервые представлены британским лингвистом Адамом Килгарриффом. [1] и используется в Sketch Engine [2] Система управления корпусом. Они являются расширением общей концепции словосочетания, используемой в корпусной лингвистике, поскольку они группируют словосочетания в соответствии с конкретными грамматическими отношениями (например, субъектом, дополнением, модификатором и т. д.). Кандидаты в словосочетания в словесном наброске сортируются либо по их частоте, либо с использованием оценки лексикографических ассоциаций, например Dice , T-score или MI-score .

С момента своего появления зарисовки слов использовались лексикографами для разработки современных корпусных словарей крупными издательствами, включая Oxford English Dictionary, [3] Словарь английского языка Macmillan [1] и включает в себя десятки языков, включая Английский, [1] Китайский, [4] Словенский, [5] японский, [6] Голландский, [7] Румынский, [8] Русский, [9] Чешский, [10] польский, [11] Вьетнамский, [12] Турецкий, [13] Португальский, [14] нет, [15] испанский [16] и другие. [17]

Официальный аккаунт

[ редактировать ]

Тройка словесного наброска — это тройка, состоящая из заглавного слова, грамматического отношения, словосочетания (например, мужчина, модификатор, молодой ).Учитывая базовый текстовый корпус , пятерка эскизов слов представляет собой пятерку, состоящую из главного слова, грамматического отношения, словосочетания, положения главного слова в корпусе, положения словосочетания в корпусе (например, человек, модификатор, молодой, 104, 103 ).База данных эскизов слов представляет собой набор таких троек или пятерок, которые могут быть сгенерированы либо путем запроса корпуса с использованием языка запросов корпуса. [18] или путем анализа корпуса с помощью анализатора естественного языка. [19]

  1. ^ Jump up to: а б с Килгаррифф, Адам; Быстро, Павел; Смрж, Павел; Тагвелл, Дэвид (2004) Sketch Engine. Информационные технологии, 2004 г.
  2. ^ Килгаррифф, Адам; Байса, Вит; Буста, Ян; Якубичек, Милош; Коварж, Войтех; Мишельфейт, Ян; Быстро, Павел; Сухомель, Вит (2004) Sketch Engine: десять лет спустя. В лексикографии, стр. 7–36, Springer Berlin Heidelberg.
  3. ^ Джонатан Калпепер (2009) Метаязык невежливости: использование Sketch Engine для изучения Оксфордского корпуса английского языка. В современной корпусной лингвистике
  4. ^ Чу-Рен Хуан, Адам Килгаррифф, Ичин Ву, Чи-Минг Чиу, Саймон Смит, Павел Рыхлы, Мин-Хонг Бай и Ке-Цзянь Чен (2005). Китайский Sketch Engine и извлечение грамматических словосочетаний. На четвертом семинаре SIGHAN по обработке китайского языка, Корея, стр. 48–55.
  5. ^ Саймон Крек и Адам Килгаррифф (2006). Словенские словесные зарисовки. В материалах 5-й конференции по технологиям словенского языка, Словения
  6. ^ Ирена Срданович, Томаж Эрьявец и Адам Килгаррифф (2008) Веб-корпус и наброски слов для японского языка в журнале обработки естественного языка 15/2, 137–159.
  7. ^ Кэрол Тибериус и Адам Килгаррифф (2009). Sketch Engine для голландского языка с корпусом ANW. В Fons Verbhorum, Festschrift для Fons Moerdijk. Институт голландской лексикологии, Нидерланды, стр. 273--255
  8. ^ Моника Маковейчук и Адам Килгаррифф (2010) Корпус RoWaC и эскизы румынских слов. «Многоязычие и совместимость языковой обработки с упором на румынский язык», Румынская академия наук.
  9. ^ Мария Хохлова и Виктор Захаров (2010) Изучение словесных зарисовок для русского языка. В материалах Седьмой Международной конференции по языковым ресурсам и оценке (LREC'12)
  10. ^ Карел Пала и Павел Рыхлы (2010) Пример использования словесных зарисовок - чешский глагол vidět. В пути со словами: последние достижения в лексической теории и анализе. Фестиваль Патрика Хэнкса.
  11. ^ Адам Радзишевский, Адам Килгаррифф и Роберт Лью (2011) Очерки польского слова. В материалах 5-й конференции по языкам и технологиям (LTC)
  12. ^ Адам Килгаррифф и Фуонг Ле-Хонг (2012) Зарисовки вьетнамских слов. Семинар по вьетнамскому языку и обработке речи (IEEE-RIVF 9)
  13. ^ Бхарат Рам Амбати, Шива Редди и Адам Килгаррифф (2012) Словесные наброски на турецком языке. В материалах Восьмой Международной конференции по языковым ресурсам и оценке (LREC'12)
  14. ^ Адам Килгаррифф, Милош Якубичек, Ян Помикалек, Тони Бербер Сардинья и Пит Уайтлок (2014) PtTenTen: Корпус португальской лексикографии. В работе с португальской корпорацией, издательство Bloomsbury Publishing
  15. ^ Анил Кришна Эрагани, Варун Кучибхотла, Дипти Шарма, Шива Редди и Адам Килгаррифф (2014) Наброски слов на хинди. В материалах конференции по обработке естественного языка (ICON-11)
  16. ^ Адам Килгаррифф и Ирен Ренау (2013) esTenTen, обширный веб-корпус полуостровного и американского испанского языка. В Procedia - Социальные и поведенческие науки
  17. ^ «Библиография Sketch Engine | Sketch Engine» . 27 марта 2015 г.
  18. ^ Милош Якубичек, Адам Килгаррифф, Диана Маккарти и Павел Рыхлы (2010) Быстрый синтаксический поиск в очень больших корпусах для многих языков. В материалах семинара по передовым корпусным решениям, PACLIC 24, Япония.
  19. ^ Алеш Горак, Павел Рыхлы, Адам Килгаррифф (2009) Отношения эскизов чешских слов с полным синтаксическим анализатором. Через полвека обработки славянского естественного языка.
[ редактировать ]
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: af59c6882e5d8c59363b0e1c76e3d00c__1688006640
URL1:https://arc.ask3.ru/arc/aa/af/0c/af59c6882e5d8c59363b0e1c76e3d00c.html
Заголовок, (Title) документа по адресу, URL1:
Word sketch - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)