Многомерный иерархический инструментарий
Набор инструментов многомерной иерархии или набор инструментов многомерной и иерархической базы данных (MDH) — это Linux на базе с открытым исходным кодом набор инструментов портативного программного обеспечения , который поддерживает очень быстрое, гибкое, многомерное и иерархическое хранение, поиск и манипулирование информацией в базах данных. размером до 256 терабайт. Пакет написан на C и C++ и доступен по лицензиям GNU GPL /LGPL/Free Documentation в виде исходного кода. Дистрибутив содержит демонстрационные реализации сетевых интерактивных инструментов поиска текста и последовательностей, которые работают с очень большими базами геномных данных и иллюстрируют возможности набора инструментов манипулировать огромными наборами данных геномной информации.
Распределение
[ редактировать ]Инструментарий распространяется как часть компилятора Mumps Compiler . Существуют версии для Linux, Cygwin и Windows XP .
Происхождение
[ редактировать ]Набор инструментов представляет собой решение проблемы манипулирования очень большими, многомерными, разреженными матрицами с индексированной строкой символов. Он основан на MUMPS (также называемом M), языке программирования общего назначения, который возник в середине 60-х годов в Массачусетской больнице общего профиля .
Ключевые особенности
[ редактировать ]Основной особенностью базы данных в этом проекте является глобальный массив , который позволяет напрямую и эффективно манипулировать многомерными массивами практически неограниченного размера. Глобальный массив — это постоянная, разреженная, необъявленная, многомерная структура со строковыми индексами данных на диске. Глобальный массив может появиться везде, где разрешена обычная ссылка на массив, а данные могут храниться как в конечных узлах, так и в промежуточных узлах массива базы данных. Количество индексов в ссылке на массив ограничено только общей длиной ссылки на массив, при этом все индексы расширяются до своих строковых значений. Инструментарий включает в себя несколько функций для просмотра базы данных и управления массивами.
Инструментарий делает базу данных и набор функций доступными в виде классов C++, а также позволяет интерпретировать выполнение устаревших сценариев Mumps. Чтобы использовать набор инструментов, вы устанавливаете дистрибутив MDH и Mumps и соответствующий код.
Реализованные функции
[ редактировать ]Инструментарий реализует устаревшие функции Mumps: $ascii(), $extract(), $find(), $horolog, $length(), $name(), $justify(), $order(), $piece(). и $test, а также векторные и матричные операции, алгоритма поиска строк Бойера-Мура-Госпера функции , функции алгоритма Смита-Уотермана , операции реляционной алгебры и доступ к библиотеке регулярных выражений, совместимой с Perl ( PCRE ).