Dicta (организация)
Украшение - Центр анализа текста | |
Лидер | Моше пара |
---|---|
Веб -сайт | https://dicta.org.il/ |
DICTA, Центр анализа текста -это израильская некоммерческая организация, ориентированная на исследования и образование в области вычислительной лингвистики и ее применения на иврите, включая религиозную литературу в разных поколениях. [ 1 ]
Организация предоставляет инструменты, которые используют алгоритмы искусственного интеллекта, машинное обучение, обработку естественного языка и языковые модели с целью исследования, обработки и анализа ивритских текстов и создания ивритского содержания. Эти инструменты доступны для бесплатного использования и открытого исходного кода в пользу общественности. [ 2 ]
Услуги
[ редактировать ]Модель SIDE-LM 2.0
[ редактировать ]В 2024 году организация вместе с Maf'at , Израильской ассоциацией человеческих языковых технологий и командой исследователей из Intel представила большую языковую модель (LLM) для коммерческого и использования исследований по лицензии Apache 2.0. Эта модель, специально адаптированная для иврита, может использоваться для различных приложений, таких как чат -боты и инструменты перевода. [ 3 ] [ 4 ]
Накбан
[ редактировать ]«Накдан»-это передовая система для автоматического Niqqud (добавление диаклитики) текста на иврите, разработанную доктором Ави Шмидман, исследователем на еврейском литературе в университете Бар-Илан и советником в Академии на ивритном языке. Элтиэль Шмидман, профессор Моше Коппел , профессор информатики, и профессор Йоав Голдберг, эксперт по компьютерным наукам и лингвистике. В отличие от других программ Niqqud, доступных на рынке, Nekdan предназначен для «понимания человеческого языка», а не просто хранения базы данных Niqqud слов и попытки сопоставить слова Unniqqud с соответствующими Niqqud. Следовательно, Некдан обычно выбирает правильный niqqud для слова. Система использует современные модели нейронной сети, а также обширные лингвистические знания и собранные вручную ресурсы для достижения высокой точности при размещении диаклитики. Система поддерживает современный, раввинский и поэтический иврит и включает в себя функции для ручной коррекции, что делает ее полезным для создания академических изданий исторических текстов. Система свободно доступна в Интернете для общественного использования. [ 5 ]
Продвинутые поисковые системы в еврейских источниках
[ редактировать ]Dicta предоставляет множество расширенных вариантов поиска для поиска слов и фраз в Библии, Талмуде и других раввинских текстах. Поиск включает в себя поиск на основе контекста, поиск по аналогичным словам, игнорирование различий в орфографии и перегибах, оптическое распознавание символов, автоматическую коррекцию ошибок распознавания на основе контекста и многого другого. [ Цитация необходима ]
Ссылки
[ редактировать ]- ^ и отчеты » . Www.guidestar.org.il . «Украшение - Центр анализа текста (IAA) - документы
- ^ Дор, Офир. «Руководители Forum Ecclesiastes разработали AI Calabot на иврите - в сотрудничестве с Министерством обороны » . Темаркер . Получено 2024-06-02 .
- ^ «Познакомьтесь с DICTA-LM 2.0-A большая, свободная и открытая языковая модель на иврите » . www.gadgety.co.il (на иврите). 2024-05-03 . Получено 2024-06-02 .
- ^ "Dicta" . dicta.org.il . Получено 2024-06-02 .
- ^ Шмидман, Ави; Шмидман, Шалля; Коппель, Моше; Голдберг, Йоав (2020). «Накдан: профессиональный ивритский диатризализатор» . Ассоциация вычислительной лингвистики: 197–203. Arxiv : 2005.03312 . doi : 10.18653/v1/2020.Acl-demos.23 .
{{cite journal}}
: CITE Journal требует|journal=
( помощь )