Базовая технология
![]() | |
Тип компании | Частный |
---|---|
Промышленность | Информационные технологии Доступ к информации Цифровая криминалистика Транслитерация |
Основан | 1995 |
Штаб-квартира | Сомервилл, Массачусетс , США |
Обслуживаемая территория | Америка Европа Азия |
Ключевые люди | Карл Хоффман (генеральный директор, соучредитель) Стивен Коэн (исполнительный вице-президент/главный операционный директор, соучредитель) Брайан Кэрриер (технический директор и генеральный директор по киберкриминалистике) Симсон Гарфинкель (главный научный сотрудник) Дзюнъити Хасегава (вице-президент по Азии) |
Продукты | КонаПоиск Кибер-сортировка Вскрытие Комплект сыщика |
Дочерние компании | ГК «БазисТех» |
Веб-сайт | http://www.basistech.com http://www.konasearch.com http://www.autopsy.com http://www.cybertriage.com |
BasisTech — компания-разработчик программного обеспечения, специализирующаяся на применении методов искусственного интеллекта для понимания документов и неструктурированных данных, написанных на разных языках. Штаб-квартира компании находится в Сомервилле, штат Массачусетс, а также дочерний офис в Токио. Юридическое название — ООО «БасисТех».
Компания была основана в 1995 году выпускниками Массачусетского технологического института с целью использования методов искусственного интеллекта для обработки естественного языка, чтобы помочь компьютерным системам понимать письменный человеческий язык. Его программное обеспечение фокусируется на анализе текста произвольной формы, чтобы приложения могли лучше понимать значение слов. Например, их программное обеспечение может идентифицировать токены, части речи и леммы. [ 1 ] Инструменты также могут идентифицировать различные формы имен и фраз. Имя человека, скажем, Альберта П. Джонса, может появляться по-разному. В некоторых текстах его будут называть «Эл Джонс», в других «мистер Джонс», а в третьих «Альберт Пол Джонс». [ 2 ]
Их программное обеспечение также выполняет извлечение объектов, то есть поиск слов, которые относятся к людям, местам и организациям, из текста для таких целей, как комплексная проверка, разведка и маркировка метаданных. [ 3 ]
Компания наиболее известна своим продуктом Rosette, который использует методы обработки естественного языка для улучшения поиска информации , анализа текста , поисковых систем и других приложений. Этот инструмент используется для того, чтобы поисковые системы могли осуществлять поиск на нескольких языках. [ 4 ] и сопоставить личности и даты. [ 5 ] Розетка была продана Бабель-стрит в 2002 году. [ 6 ]
Программное обеспечение BasisTech также используется судебными аналитиками для поиска в файлах слов, токенов, фраз или чисел, которые могут быть важны для следователей. [ 7 ] а также предоставить программное обеспечение (Cyber Triage), которое помогает организациям реагировать на кибератаки. [ 8 ]
Розетка
[ редактировать ]Rosette поставляется в виде облачного (публичного или локального) развертывания или Java SDK. [ 9 ] Rosette предоставляет различные инструменты обработки естественного языка для неструктурированного текста: идентификация языка , базовая лингвистика, извлечение сущностей , сопоставление имен, перевод имен, анализ настроений , семантическое сходство , извлечение отношений , извлечение тем, категоризация и перевод арабского чата. [ 10 ] Его можно интегрировать в приложения для улучшения соблюдения финансовых требований. [ 11 ] соблюдение требований наблюдения за связью, [ 12 ] мониторинг социальных сетей, [ 13 ] разведка киберугроз, [ 14 ] и анализ отзывов клиентов. [ 15 ]
Лингвистическая платформа Rosette состоит из следующих модулей:
- Rosette Language Identifier анализирует структурную и статистическую подпись файла для идентификации языка. Предварительно настроенное программное обеспечение может распознавать 55 различных языков с 45 различными кодировками.
- Базовая лингвистика Rosette определяет лемму или основу слова после обнаружения токенов. Поиск зачастую выполняется быстрее и точнее, если слова сгруппированы по их основе. [ 16 ]
- Rosette Entity Extractor анализирует необработанный текст и определяет возможную роль, которую слова и фразы играют в документе. Это ключевой шаг, который позволяет алгоритмам различать различные значения, которые могут иметь многие слова. Разделение необработанного текста на группы слов в соответствии с их ролью и последующая классификация их вклада в значение часто называется анализом сущностей. Гибридный подход Basis сочетает статистическое моделирование с правилами, регулярными выражениями и справочниками — списками специальных слов, которые можно настроить под анализируемый язык и текст. Инструмент предназначен для прямой работы с различными алфавитами и несколькими языками, что является преимуществом, поскольку иностранные слова часто транслитерируются разными способами. [ 17 ] Считается, что это первый коммерчески доступный инструмент для анализа арабского текста. [ 18 ]
- Rosette Name Translator транслитерирует нелатинские алфавиты, такие как арабский, в последовательную латинскую форму.
- Индексатор имен Rosette обеспечивает простой поиск по вариантам имени либо путем подключения к поисковым системам с открытым исходным кодом, либо в виде отдельной службы. [ 19 ]
- Базовая библиотека Rosette для Unicode упрощает использование текста Unicode. [ нужны разъяснения ]
- Rosette Chat Translator для арабского языка преобразует слова из арабского алфавита чата в арабский.
Rosette используется как в правительственных учреждениях США для поддержки перевода, так и в крупных фирмах, занимающихся инфраструктурой Интернета, таких как поисковые системы. [ 20 ] [ 21 ]
Цифровая криминалистика
[ редактировать ]с открытым исходным кодом цифровой криминалистики BasisTech разрабатывает инструменты , The Sleuth Kit и Autopsy , которые помогают идентифицировать и извлекать улики из устройств хранения данных, таких как жесткие диски или флэш-карты, а также таких устройств, как смартфоны и iPod. Модель лицензирования с открытым исходным кодом позволяет использовать их в качестве основы для более крупных проектов, таких как инструмент на базе Hadoop для массово-параллельного судебно-медицинского анализа очень больших коллекций данных.
Набор инструментов цифровой криминалистики используется для анализа файловых систем, новых типов носителей, новых типов файлов и метаданных файловой системы. Инструменты могут искать определенные шаблоны в файлах, что позволяет нацеливаться на важные файлы или профили использования. Например, он может искать общие файлы с помощью хеш-функций, а также деконструировать структуры данных важных файлов журналов операционной системы.
Инструменты предназначены для настройки с помощью открытой архитектуры плагинов. Basis Technology помогает управлять большим и разнообразным сообществом разработчиков, которые используют этот инструмент в расследованиях.
КонаПоиск
[ редактировать ]BasisTech приобрела KonaSearch в июне 2019 года. [ 22 ] стартап, специализирующийся на поиске Salesforce.com и других репозиториях офисных баз данных, который может автоматизировать этап поиска в рабочих процессах бизнеса. [ 23 ]
Ссылки
[ редактировать ]- ^ «Базовая лингвистика» .
- ^ «Индексатор имен — совпадение имен» .
- ^ «Экстрактор сущностей — распознавание сущностей» .
- ^ «Плагины Elasticsearch — расширение Elasticsearch» .
- ^ «Плагины Elasticsearch — расширение Elasticsearch» .
- ^ «Бабель-стрит завершает весьма успешный 2022 год приобретением розетки» . www.businesswire.com . 10 января 2023 г. Проверено 11 апреля 2024 г.
- ^ «Индивидуальные решения для цифровой криминалистики» .
- ^ "О" .
- ^ «Базовая лингвистика» .
- ^ «Розетковая текстовая аналитика» .
- ^ «Поддерживать» .
- ^ «Сосьете Женераль» .
- ^ «Сенсика» .
- ^ «Революционная платформа анализа угроз» .
- ^ «Понимать, измерять и действовать с учетом отзывов потребителей» .
- ^ Эрард, Майкл (1 марта 2004 г.). «Перевод в эпоху террора» . Обзор технологий .
- ^ Бойд, Кларк (14 января 2004 г.). «Языковые средства борьбы с терроризмом» . Новости Би-би-си .
- ^ Вайс, Тодд Р. (10 марта 2003 г.). «Программное обеспечение для языкового анализа помогает в поиске террористической деятельности в Интернете в США» . Компьютерный мир .
- ^ Профиль в Boston Business Journal
- ^ Холлмер, Марк (21 марта 2003 г.). «Basis Technology уделяет особое внимание государственной безопасности» . Бостонский деловой журнал .
- ^ Бейкер, Лорен (30 ноября 2004 г.). «Поисковая система MSN использует базовую технологию для обработки естественного языка» . Журнал поисковых систем .
- ^ «Basis Technology обеспечивает глубокий поиск в Salesforce» .
- ^ "О нас" .