Что такое система хранения данных: разбираемся вместе
Если вы владелец бизнеса или крупного проекта, надежное хранение данных — это один из самых главных приоритетов. Но как организовать хранилище, если количество данных стремительно растет каждый день? В этом поможет СХД, о котором мы расскажем в этой статье.
Что такое СХД
СХД (Система Хранения Данных или Сервер для Хранения Данных) — это физический сервер (или часть пространства сервера), который предназначен для хранения и обработки информации. Чаще всего СХД используется для работы с большими данными. Например:
- резервное копирование,
- видеонаблюдение,
- документооборот внутри одной компании,
- системы управления базами данных и др.
На скорость и специфику работы конкретной СХД влияют два фактора:
- архитектура сервера,
- тип сетевого доступа.
- блочными,
- файловыми,
- объектными.
- Клиент (чаще всего клиентом называют браузер) отправляет запрос серверу.
- Сервер принимает запрос и ищет блок информации, которую нужно передать в ответе.
- Сервер обращается к блоку по идентификатору и «достает» из него информацию, которую нужно передать в ответе.
- Сервер отдает ответ браузеру.
Эти параметры мы опишем ниже. В первую очередь расскажем об архитектуре.
Хранение данных: 3 популярных типа СХД
Система хранения данных может быть организована и запрограммирована разными способами. Носители данных могут быть:
Ниже мы описали особенности работы инфраструктуры, а также плюсы и минусы каждого типа СХД.
Блочная СХД
Название говорит само за себя — данные на этом типе хранилища разделены на блоки одинакового объема. При этом в блоках хранятся не готовые файлы, а части данных. Каждая такая часть называется чанком.
Чанк (chunk) — это наибольшая единица дискового пространства сервера, которая выделяется для хранения информации. Размер чанка зависит от строения физического диска (например, SSD или HDD) и от настроек операционной системы сервера. Каждый чанк хранится в отдельном блоке.
Как работает блочная СХД? Система присваивает числовые идентификаторы каждому блоку данных и использует их, когда нужно предоставить информацию. Алгоритм запроса данных выглядит так:
Блочная организация СХД имеет преимущества:
- высокая производительность. Быстродействие блочной СХД позволяет работать с данными, которые требуют аппаратных вычислений;
- гибкая настройка. По мере роста объема данных можно добавлять новые тома с блоками, не теряя производительности;
- легко редактировать файлы. При редактировании файла перезаписываются только те чанки, которые затронули изменения, — это помогает не терять быстродействие;
- просто управлять доступом к информации. Блочные СХД позволяют настроить любые виды доступа к данным.
Однако блочное устройство имеет несколько недостатков:
- строгая привязка к одному серверу. Блочная СХД не разрешает доступ с другого сервера. Это ограничение можно обойти с помощью ПО, но тогда увеличится нагрузка на хранилище;
- ограниченные метаданные (информация о типе файла). Это влияет на работу приложений, которые требовательны к метаданным;
- высокая стоимость в сравнении с другими типами СХД.
Файловая СХД
Файловые устройства под хранение информации максимально похожи на то, как операционная система отображается на компьютере: файлы вложены в подпапки, а подпапки — в другие папки и т. д.
Как и в блочной СХД, в файловой системе каждому файлу присваивается идентификатор. Он включает в себя:
- имя сервера, на котором расположен файл,
- путь к файлу от корневой директории сервера,
- имя файла.
Файловая СХД имеет принципиальное отличие от других вариантов — это разные уровни директорий, от которых зависит тип доступа к файлам. Остановимся на них подробнее:
Одноуровневые директории — папки, которые находятся на одном уровне вложенности друг с другом. В одноуровневых директориях файлы доступны всем пользователям, однако в разных учетных записях нельзя хранить файлы с одинаковыми названиями.
Двухуровневые директории — подпапки, которые вложены в корневую директорию. При такой организации файловой системы можно организовать индивидуальный доступ к файлами, а также хранить файлы с одинаковыми названиями в разных учетных записях.
Древообразная модель — папки, которые имеют несколько уровней вложенности. Эта структура может сочетать в себе функционал одноуровневых и двухуровневых директорий.
Какие достоинства имеет файловая СХД:
- максимально простой функционал, который максимально приближен к интерфейсу графической операционной системы;
- функция поиска, с помощью которой можно найти файл при любом уровне его вложенности;
- низкая цена относительно других типов СХД.
Единственный недостаток этого типа хранилища — ограниченное масштабирование. Чем больше файлов создается в системе, тем медленнее отклик сервера.
Объектная СХД
Объектная СХД — это хранилище для неструктурированных данных. Данные в нем делятся на объекты с уникальными идентификаторами и подробными метаданными: всё это нужно для удобного поиска объектов.
Главное преимущество объектной СХД — это практически неограниченная масштабируемость: ее можно использовать для аналитики, тяжеловесных медиафайлов, работы с big data, резервных копий, создания сред разработки и др.
Единственный недостаток объектной СХД — низкий отклик от сервера в сравнении с другими типами хранилищ.
Виды сетевого доступа к хранилищу
Для корректной работы СХД важно выбрать не только тип архитектуры дискового пространства, — то есть места для хранения данных — но и вид сетевого доступа. Как правило, используется три технологии:
- NAS,
- SAN,
- DAS.
Ниже мы подробнее расскажем о каждом из типов сетевого доступа к хранилищу.
NAS
Network Attached Storage (NAS) переводится с английского как «сетевое хранилище». Этот перевод отлично отражает суть: NAS-хранилище представляет собой сетевой сервер. Как это работает? Объясним на примере.
Предположим, что у вас есть компьютер, смартфон и WiFi-роутер. Для выхода в интернет с каждого из устройств вы используете один и тот же роутер. В этот момент компьютер, смартфон и WiFi-роутер становятся частями одной виртуальной сети.
Сервер NAS состоит из большого количества дисков, которые объединены в RAID-массив — единый модуль. В свою очередь этот массив — часть сети, которая работает по заданным правилам и протоколам, например:
- SMB/CIFS,
- NFS,
- FTP,
- SFTP,
- HTTP,
- WebDAV,
- DC и др.
На практике эта сеть может быть реализована по-разному. К серверу могут быть подключены другие серверы (физические или виртуальные), а также дисковые станции — устройства, которые помогают увеличить объем за счет съемных жестких дисков.
Хранилища NAS имеют ряд достоинств:
- низкая стоимость,
- можно увеличить объем диска по необходимости,
- простая настройка и управление,
- доступ к файлам можно получить с любой операционной системы.
Однако есть и недостатки:
- данные можно хранить только в виде файлов,
- некоторые приложения не совместимы с сетевыми дисками,
- любые виды доступа к информации по сетевым протоколам работают медленнее в сравнении с другими вариантами.
SAN
Storage Area Network (SAN) — это сети хранения данных. Чаще всего они представлены в виде внешних накопителей для нескольких блочных сетевых устройств и работают по протоколам FC и iSCSI.
Каковы преимущества SAN:
- высокая скорость работы,
- возможность гибко настроить хранилище — например, интегрировать в единую сеть,
- высокий уровень безопасности при обмене данными.
Также SAN имеет недостатки:
- сложная настройка,
- не всё программное обеспечение совместимо с протоколом iSCSI,
- высокая стоимость.
DAS
Direct Attach Storage (DAS) — это прямое подключение к хранилищу или рабочей станции. Например, подключение съемного жесткого диска к компьютеру с помощью кабеля USB похоже на схему работы DAS.
DAS-хранилище имеет в своем составе блок питания, систему охлаждения и RAID-контроллер — это помогает системе работать лучше.
Какие преимущества имеет DAS:
- хранилище легко настраивать и администрировать,
- высокая производительность,
- сравнительно низкая стоимость.
Также DAS имеет два недостатка:
- реализуема только на выделенном сервере,
- количество подключений ограничено: не более двух серверов.
Как выбрать подходящую СХД
При выборе системы хранения данных стоит опираться на пять параметров:
- Формат данных. Для каждого типа данных подходят разные типы СХД. Например, архитектура СХД для работы с крупными медиафайлами будет отличаться от сервера с неструктурированными данными.
- Объем диска. При выборе размера дискового пространства также стоит опираться на тип и объем данных: в некоторых случаях может потребоваться несколько терабайт пространства, а иногда хватит и недорогого SSD.
- Производительность. Для выбора сервера с подходящей производительностью стоит определить, какую нагрузку должен выдерживать ваш проект.
- Отказоустойчивость. Необходимо рассчитать, в какую сумму обойдется потеря данных за определенный отрезок времени. Это поможет избежать лишних затрат на резервное копирование.
- Оборудование. После того как вы определили системные требования вашего проекта, выберите оборудование. Возможно, вам потребуется мощный физический сервер, а может, и сравнительно недорогой вариант.
Подведем итоги: все популярные типы архитектуры и сетевого доступа СХД полезны, однако при выборе подходящего решения стоит сфокусироваться на типе данных и системных требованиях проекта. Если вы находитесь в поиске подходящего оборудования, можете выбрать готовую конфигурацию на странице Аренда выделенного сервера или заказать индивидуальное решение через форму «Подбор сервера специалистом».
Перейти на оригинал