Если вы владелец бизнеса или крупного проекта, надежное хранение данных — это один из самых главных приоритетов. Но как организовать хранилище, если количество данных стремительно растет каждый день? В этом поможет СХД, о котором мы расскажем в этой статье.
СХД (Система Хранения Данных или Сервер для Хранения Данных) — это физический сервер (или часть пространства сервера), который предназначен для хранения и обработки информации. Чаще всего СХД используется для работы с большими данными. Например:
На скорость и специфику работы конкретной СХД влияют два фактора:
Эти параметры мы опишем ниже. В первую очередь расскажем об архитектуре.
Система хранения данных может быть организована и запрограммирована разными способами. Носители данных могут быть:
Ниже мы описали особенности работы инфраструктуры, а также плюсы и минусы каждого типа СХД.
Название говорит само за себя — данные на этом типе хранилища разделены на блоки одинакового объема. При этом в блоках хранятся не готовые файлы, а части данных. Каждая такая часть называется чанком.
Чанк (chunk) — это наибольшая единица дискового пространства сервера, которая выделяется для хранения информации. Размер чанка зависит от строения физического диска (например, SSD или HDD) и от настроек операционной системы сервера. Каждый чанк хранится в отдельном блоке.
Как работает блочная СХД? Система присваивает числовые идентификаторы каждому блоку данных и использует их, когда нужно предоставить информацию. Алгоритм запроса данных выглядит так:
Блочная организация СХД имеет преимущества:
Однако блочное устройство имеет несколько недостатков:
Файловые устройства под хранение информации максимально похожи на то, как операционная система отображается на компьютере: файлы вложены в подпапки, а подпапки — в другие папки и т. д.
Как и в блочной СХД, в файловой системе каждому файлу присваивается идентификатор. Он включает в себя:
Файловая СХД имеет принципиальное отличие от других вариантов — это разные уровни директорий, от которых зависит тип доступа к файлам. Остановимся на них подробнее:
Одноуровневые директории — папки, которые находятся на одном уровне вложенности друг с другом. В одноуровневых директориях файлы доступны всем пользователям, однако в разных учетных записях нельзя хранить файлы с одинаковыми названиями.
Двухуровневые директории — подпапки, которые вложены в корневую директорию. При такой организации файловой системы можно организовать индивидуальный доступ к файлами, а также хранить файлы с одинаковыми названиями в разных учетных записях.
Древообразная модель — папки, которые имеют несколько уровней вложенности. Эта структура может сочетать в себе функционал одноуровневых и двухуровневых директорий.
Какие достоинства имеет файловая СХД:
Единственный недостаток этого типа хранилища — ограниченное масштабирование. Чем больше файлов создается в системе, тем медленнее отклик сервера.
Объектная СХД — это хранилище для неструктурированных данных. Данные в нем делятся на объекты с уникальными идентификаторами и подробными метаданными: всё это нужно для удобного поиска объектов.
Главное преимущество объектной СХД — это практически неограниченная масштабируемость: ее можно использовать для аналитики, тяжеловесных медиафайлов, работы с big data, резервных копий, создания сред разработки и др.
Единственный недостаток объектной СХД — низкий отклик от сервера в сравнении с другими типами хранилищ.
Для корректной работы СХД важно выбрать не только тип архитектуры дискового пространства, — то есть места для хранения данных — но и вид сетевого доступа. Как правило, используется три технологии:
Ниже мы подробнее расскажем о каждом из типов сетевого доступа к хранилищу.
Network Attached Storage (NAS) переводится с английского как «сетевое хранилище». Этот перевод отлично отражает суть: NAS-хранилище представляет собой сетевой сервер. Как это работает? Объясним на примере.
Предположим, что у вас есть компьютер, смартфон и WiFi-роутер. Для выхода в интернет с каждого из устройств вы используете один и тот же роутер. В этот момент компьютер, смартфон и WiFi-роутер становятся частями одной виртуальной сети.
Сервер NAS состоит из большого количества дисков, которые объединены в RAID-массив — единый модуль. В свою очередь этот массив — часть сети, которая работает по заданным правилам и протоколам, например:
На практике эта сеть может быть реализована по-разному. К серверу могут быть подключены другие серверы (физические или виртуальные), а также дисковые станции — устройства, которые помогают увеличить объем за счет съемных жестких дисков.
Хранилища NAS имеют ряд достоинств:
Однако есть и недостатки:
Storage Area Network (SAN) — это сети хранения данных. Чаще всего они представлены в виде внешних накопителей для нескольких блочных сетевых устройств и работают по протоколам FC и iSCSI.
Каковы преимущества SAN:
Также SAN имеет недостатки:
Direct Attach Storage (DAS) — это прямое подключение к хранилищу или рабочей станции. Например, подключение съемного жесткого диска к компьютеру с помощью кабеля USB похоже на схему работы DAS.
DAS-хранилище имеет в своем составе блок питания, систему охлаждения и RAID-контроллер — это помогает системе работать лучше.
Какие преимущества имеет DAS:
Также DAS имеет два недостатка:
При выборе системы хранения данных стоит опираться на пять параметров:
Подведем итоги: все популярные типы архитектуры и сетевого доступа СХД полезны, однако при выборе подходящего решения стоит сфокусироваться на типе данных и системных требованиях проекта. Если вы находитесь в поиске подходящего оборудования, можете выбрать готовую конфигурацию на странице Аренда выделенного сервера или заказать индивидуальное решение через форму «Подбор сервера специалистом».
Еще на эту тему: