Jump to content

Dicta (организация)

Заявление
Украшение - Центр анализа текста
Лидер Моше пара
Веб -сайт https://dicta.org.il/

DICTA, Центр анализа текста -это израильская некоммерческая организация, ориентированная на исследования и образование в области вычислительной лингвистики и ее применения на иврите, включая религиозную литературу в разных поколениях. [ 1 ]

Организация предоставляет инструменты, которые используют алгоритмы искусственного интеллекта, машинное обучение, обработку естественного языка и языковые модели с целью исследования, обработки и анализа ивритских текстов и создания ивритского содержания. Эти инструменты доступны для бесплатного использования и открытого исходного кода в пользу общественности. [ 2 ]

Модель SIDE-LM 2.0

[ редактировать ]

В 2024 году организация вместе с Maf'at , Израильской ассоциацией человеческих языковых технологий и командой исследователей из Intel представила большую языковую модель (LLM) для коммерческого и использования исследований по лицензии Apache 2.0. Эта модель, специально адаптированная для иврита, может использоваться для различных приложений, таких как чат -боты и инструменты перевода. [ 3 ] [ 4 ]

«Накдан»-это передовая система для автоматического Niqqud (добавление диаклитики) текста на иврите, разработанную доктором Ави Шмидман, исследователем на еврейском литературе в университете Бар-Илан и советником в Академии на ивритном языке. Элтиэль Шмидман, профессор Моше Коппел , профессор информатики, и профессор Йоав Голдберг, эксперт по компьютерным наукам и лингвистике. В отличие от других программ Niqqud, доступных на рынке, Nekdan предназначен для «понимания человеческого языка», а не просто хранения базы данных Niqqud слов и попытки сопоставить слова Unniqqud с соответствующими Niqqud. Следовательно, Некдан обычно выбирает правильный niqqud для слова. Система использует современные модели нейронной сети, а также обширные лингвистические знания и собранные вручную ресурсы для достижения высокой точности при размещении диаклитики. Система поддерживает современный, раввинский и поэтический иврит и включает в себя функции для ручной коррекции, что делает ее полезным для создания академических изданий исторических текстов. Система свободно доступна в Интернете для общественного использования. [ 5 ]

Продвинутые поисковые системы в еврейских источниках

[ редактировать ]

Dicta предоставляет множество расширенных вариантов поиска для поиска слов и фраз в Библии, Талмуде и других раввинских текстах. Поиск включает в себя поиск на основе контекста, поиск по аналогичным словам, игнорирование различий в орфографии и перегибах, оптическое распознавание символов, автоматическую коррекцию ошибок распознавания на основе контекста и многого другого. [ Цитация необходима ]

  1. ^ и отчеты » . Www.guidestar.org.il . «Украшение - Центр анализа текста (IAA) - документы
  2. ^ Дор, Офир. «Руководители Forum Ecclesiastes разработали AI Calabot на иврите - в сотрудничестве с Министерством обороны » . Темаркер . Получено 2024-06-02 .
  3. ^ «Познакомьтесь с DICTA-LM 2.0-A большая, свободная и открытая языковая модель на иврите » . www.gadgety.co.il (на иврите). 2024-05-03 . Получено 2024-06-02 .
  4. ^ "Dicta" . dicta.org.il . Получено 2024-06-02 .
  5. ^ Шмидман, Ави; Шмидман, Шалля; Коппель, Моше; Голдберг, Йоав (2020). «Накдан: профессиональный ивритский диатризализатор» . Ассоциация вычислительной лингвистики: 197–203. Arxiv : 2005.03312 . doi : 10.18653/v1/2020.Acl-demos.23 . {{cite journal}}: CITE Journal требует |journal= ( помощь )
Arc.Ask3.Ru: конец переведенного документа.
Arc.Ask3.Ru
Номер скриншота №: d58304d14b05e45e99214c3d0c504023__1722782820
URL1:https://arc.ask3.ru/arc/aa/d5/23/d58304d14b05e45e99214c3d0c504023.html
Заголовок, (Title) документа по адресу, URL1:
Dicta (organization) - Wikipedia
Данный printscreen веб страницы (снимок веб страницы, скриншот веб страницы), визуально-программная копия документа расположенного по адресу URL1 и сохраненная в файл, имеет: квалифицированную, усовершенствованную (подтверждены: метки времени, валидность сертификата), открепленную ЭЦП (приложена к данному файлу), что может быть использовано для подтверждения содержания и факта существования документа в этот момент времени. Права на данный скриншот принадлежат администрации Ask3.ru, использование в качестве доказательства только с письменного разрешения правообладателя скриншота. Администрация Ask3.ru не несет ответственности за информацию размещенную на данном скриншоте. Права на прочие зарегистрированные элементы любого права, изображенные на снимках принадлежат их владельцам. Качество перевода предоставляется как есть. Любые претензии, иски не могут быть предъявлены. Если вы не согласны с любым пунктом перечисленным выше, вы не можете использовать данный сайт и информация размещенную на нем (сайте/странице), немедленно покиньте данный сайт. В случае нарушения любого пункта перечисленного выше, штраф 55! (Пятьдесят пять факториал, Денежную единицу (имеющую самостоятельную стоимость) можете выбрать самостоятельно, выплаичвается товарами в течение 7 дней с момента нарушения.)