Сетка файловой системы
Эта статья нуждается в дополнительных цитатах для проверки . ( август 2008 г. ) |
Сетчатая файловая система — это компьютерная файловая система, целью которой является повышение надежности и доступности за счет использования множества небольших областей хранения файлов. [1]
Компоненты
[ редактировать ]Файловые системы содержат до трех компонентов:
- Таблица файлов (таблица FAT, MFT и т. д.)
- Данные файла
- Метаданные (права пользователя и т. д.)
Сетчатая файловая система будет иметь аналогичные потребности:
- Таблица файлов (или индекс поиска)
- Данные файла
- Метаданные
Сравнения
[ редактировать ]Поскольку файловые системы спроектированы так, чтобы представлять собой один диск, которым может управлять (полностью) один компьютер, в сценарии сетки возникает множество новых проблем, при которых любой отдельный диск в сети должен быть способен обрабатывать запросы на любые данные, содержащиеся в сетке.
Функции
[ редактировать ]В большинстве файловых хранилищ используются уровни избыточности для достижения высокого уровня защиты данных (невозможность потери данных). Текущие средства резервирования включают репликацию и проверку четности. Такая избыточность может быть реализована с помощью RAID- массива (при этом несколько физических дисков отображаются на локальном компьютере как один диск, что может включать репликацию данных и/или разделение диска).Точно так же файловая система сетки будет состоять из некоторого уровня избыточности (либо на уровне логического файла, либо на уровне блоков, возможно, включая некоторую проверку четности) на различных дисках, присутствующих в «сетке».
Рамки
[ редактировать ]Прежде всего, необходим механизм таблицы файлов. Кроме того, таблица файлов должна включать механизм поиска файла (целевого/назначения) в сетке.Во-вторых, должен существовать механизм работы с файловыми данными. Этот механизм отвечает за доступность данных файла для запросов.
Выполнение
[ редактировать ]С технологией BitTorrent можно провести параллель с файловой системой сетки, в которой торрент-трекер (и поисковая система) будет «таблицей файлов», а торрент-приложения (передающие файлы) будут компонентом «данных файла». .Механизм , подобный RSS- каналу, может использоваться узлами таблицы файлов для указания того, когда в таблицу добавляются новые файлы, для запуска репликации и других подобных компонентов.
Файловая система может включать аналогичную технологию (распределенная репликация, распределенный запрос/выполнение данных).
Если бы к обеим таким системам (таблица файлов и данные файла) можно было обращаться как к единому объекту (т. е. с использованием виртуальных узлов в кластере), то рост такой системы можно было бы легко контролировать, просто решая, какой элемент сетки будет использоваться. нести ответственность (таблица файлов и поиск файлов и/или данные файлов).
Доступность
[ редактировать ]Если предположить, что существует какой-то метод автономного управления репликацией данных (назначение квот и т. д.) внутри сети, данные можно настроить для обеспечения высокой доступности, независимо от их потери или сбоя.
Проблемы
[ редактировать ]Самая большая проблема в настоящее время связана с распространением обновлений данных. Торренты поддерживают минимальную иерархию (в настоящее время реализованную либо в виде метаданных в торрент-трекере, либо строго в виде пользовательского интерфейса и базовой категоризации). Одновременное обновление нескольких узлов (при условии, что требуются атомарные транзакции) приводит к задержкам во время обновлений и дополнений, обычно до такой степени, что это становится невозможным.Кроме того, файловая система на основе сетки (сетевая) нарушает традиционные парадигмы TCP/IP, поскольку файловая система (как правило, низкоуровневая, тип операций кольца 0) требует сложных реализаций TCP/IP, вводя уровни абстракции и усложняя процесс создания. такая сетка файловой системы.
Примеры
[ редактировать ]Примеры данных высокой доступности включают в себя:
- сетевой Балансировка нагрузки / CARP — разделение входящих запросов на несколько компьютеров, обычно настроенных одинаково или как единое целое.
- общего хранилища Кластеризация / сети SAN — один диск (один или несколько физических дисков, действующих как один логический диск) предоставляется нескольким компьютерам, которые разделяют входящие запросы. Обычно это используется, когда требуется больше вычислительной мощности, чем доступ к диску.
- /зеркалирование данных Репликация – несколько компьютеров могут попытаться синхронизировать данные (обычно на определенный момент времени или на основе моментального снимка). Чаще используется либо для создания отчетов (на основе последнего снимка), либо для резервного копирования.
- данных Разделение – разделение данных между несколькими компьютерами. В базах данных данные часто секционируются на основе таблиц (определенные таблицы существуют на определенных компьютерах или таблица разделена между несколькими компьютерами в определенных «точках останова»)... общие файлы, как правило, делятся либо по категориям (папки на основе категорий). , или местоположение (географически разделенное).
См. также
[ редактировать ]Ссылки
[ редактировать ]- ^ Маад, Соха; Коглан, Брайан; Куигли, Джефф; Райан, Джон; Кенни, Имонн; о'Каллаган, Дэвид (2007). «На пути к полной функциональности файловой системы сетки». Компьютерные системы будущего поколения . 23 : 123–131. дои : 10.1016/j.future.2006.06.006 .