Бортовой журнал
Бортовой журнал

Если вы владелец бизнеса или крупного проекта, надежное хранение данных — это один из самых главных приоритетов. Но как организовать хранилище, если количество данных стремительно растет каждый день? В этом поможет СХД, о котором мы расскажем в этой статье.

Что такое СХД

СХД (Система Хранения Данных или Сервер для Хранения Данных) — это физический сервер (или часть пространства сервера), который предназначен для хранения и обработки информации. Чаще всего СХД используется для работы с большими данными. Например:

  • резервное копирование,
  • видеонаблюдение,
  • документооборот внутри одной компании,
  • системы управления базами данных и др.

На скорость и специфику работы конкретной СХД влияют два фактора:

  • архитектура сервера,
  • тип сетевого доступа.
  • Эти параметры мы опишем ниже. В первую очередь расскажем об архитектуре.

    Хранение данных: 3 популярных типа СХД

    Система хранения данных может быть организована и запрограммирована разными способами. Носители данных могут быть:

    • блочными,
    • файловыми,
    • объектными.

    Ниже мы описали особенности работы инфраструктуры, а также плюсы и минусы каждого типа СХД.

    Блочная СХД

    Название говорит само за себя — данные на этом типе хранилища разделены на блоки одинакового объема. При этом в блоках хранятся не готовые файлы, а части данных. Каждая такая часть называется чанком.

    Чанк (chunk) — это наибольшая единица дискового пространства сервера, которая выделяется для хранения информации. Размер чанка зависит от строения физического диска (например, SSD или HDD) и от настроек операционной системы сервера. Каждый чанк хранится в отдельном блоке.

    Как работает блочная СХД? Система присваивает числовые идентификаторы каждому блоку данных и использует их, когда нужно предоставить информацию. Алгоритм запроса данных выглядит так:

    1. Клиент (чаще всего клиентом называют браузер) отправляет запрос серверу.
    2. Сервер принимает запрос и ищет блок информации, которую нужно передать в ответе.
    3. Сервер обращается к блоку по идентификатору и «достает» из него информацию, которую нужно передать в ответе.
    4. Сервер отдает ответ браузеру.

Блочная организация СХД имеет преимущества:

  • высокая производительность. Быстродействие блочной СХД позволяет работать с данными, которые требуют аппаратных вычислений;
  • гибкая настройка. По мере роста объема данных можно добавлять новые тома с блоками, не теряя производительности;
  • легко редактировать файлы. При редактировании файла перезаписываются только те чанки, которые затронули изменения, — это помогает не терять быстродействие;
  • просто управлять доступом к информации. Блочные СХД позволяют настроить любые виды доступа к данным.

Однако блочное устройство имеет несколько недостатков:

  • строгая привязка к одному серверу. Блочная СХД не разрешает доступ с другого сервера. Это ограничение можно обойти с помощью ПО, но тогда увеличится нагрузка на хранилище;
  • ограниченные метаданные (информация о типе файла). Это влияет на работу приложений, которые требовательны к метаданным;
  • высокая стоимость в сравнении с другими типами СХД.

Файловая СХД

Файловые устройства под хранение информации максимально похожи на то, как операционная система отображается на компьютере: файлы вложены в подпапки, а подпапки — в другие папки и т. д.

Как и в блочной СХД, в файловой системе каждому файлу присваивается идентификатор. Он включает в себя:

  • имя сервера, на котором расположен файл,
  • путь к файлу от корневой директории сервера,
  • имя файла.

Файловая СХД имеет принципиальное отличие от других вариантов — это разные уровни директорий, от которых зависит тип доступа к файлам. Остановимся на них подробнее:

Одноуровневые директории — папки, которые находятся на одном уровне вложенности друг с другом. В одноуровневых директориях файлы доступны всем пользователям, однако в разных учетных записях нельзя хранить файлы с одинаковыми названиями.

Двухуровневые директории — подпапки, которые вложены в корневую директорию. При такой организации файловой системы можно организовать индивидуальный доступ к файлами, а также хранить файлы с одинаковыми названиями в разных учетных записях.

Древообразная модель — папки, которые имеют несколько уровней вложенности. Эта структура может сочетать в себе функционал одноуровневых и двухуровневых директорий.

Какие достоинства имеет файловая СХД:

  • максимально простой функционал, который максимально приближен к интерфейсу графической операционной системы;
  • функция поиска, с помощью которой можно найти файл при любом уровне его вложенности;
  • низкая цена относительно других типов СХД.

Единственный недостаток этого типа хранилища — ограниченное масштабирование. Чем больше файлов создается в системе, тем медленнее отклик сервера.

Объектная СХД

Объектная СХД — это хранилище для неструктурированных данных. Данные в нем делятся на объекты с уникальными идентификаторами и подробными метаданными: всё это нужно для удобного поиска объектов.

Главное преимущество объектной СХД — это практически неограниченная масштабируемость: ее можно использовать для аналитики, тяжеловесных медиафайлов, работы с big data, резервных копий, создания сред разработки и др.

Единственный недостаток объектной СХД — низкий отклик от сервера в сравнении с другими типами хранилищ.

Виды сетевого доступа к хранилищу

Для корректной работы СХД важно выбрать не только тип архитектуры дискового пространства, — то есть места для хранения данных — но и вид сетевого доступа. Как правило, используется три технологии:

  • NAS,
  • SAN,
  • DAS.

Ниже мы подробнее расскажем о каждом из типов сетевого доступа к хранилищу.

NAS

Network Attached Storage (NAS) переводится с английского как «сетевое хранилище». Этот перевод отлично отражает суть: NAS-хранилище представляет собой сетевой сервер. Как это работает? Объясним на примере.

Предположим, что у вас есть компьютер, смартфон и WiFi-роутер. Для выхода в интернет с каждого из устройств вы используете один и тот же роутер. В этот момент компьютер, смартфон и WiFi-роутер становятся частями одной виртуальной сети.

Сервер NAS состоит из большого количества дисков, которые объединены в RAID-массив — единый модуль. В свою очередь этот массив — часть сети, которая работает по заданным правилам и протоколам, например:

  • SMB/CIFS,
  • NFS,
  • FTP,
  • SFTP,
  • HTTP,
  • WebDAV,
  • DC и др.

На практике эта сеть может быть реализована по-разному. К серверу могут быть подключены другие серверы (физические или виртуальные), а также дисковые станции — устройства, которые помогают увеличить объем за счет съемных жестких дисков.

Хранилища NAS имеют ряд достоинств:

  • низкая стоимость,
  • можно увеличить объем диска по необходимости,
  • простая настройка и управление,
  • доступ к файлам можно получить с любой операционной системы.

Однако есть и недостатки:

  • данные можно хранить только в виде файлов,
  • некоторые приложения не совместимы с сетевыми дисками,
  • любые виды доступа к информации по сетевым протоколам работают медленнее в сравнении с другими вариантами.

SAN

Storage Area Network (SAN) — это сети хранения данных. Чаще всего они представлены в виде внешних накопителей для нескольких блочных сетевых устройств и работают по протоколам FC и iSCSI.

Каковы преимущества SAN:

  • высокая скорость работы,
  • возможность гибко настроить хранилище — например, интегрировать в единую сеть,
  • высокий уровень безопасности при обмене данными.

Также SAN имеет недостатки:

  • сложная настройка,
  • не всё программное обеспечение совместимо с протоколом iSCSI,
  • высокая стоимость.

DAS

Direct Attach Storage (DAS) — это прямое подключение к хранилищу или рабочей станции. Например, подключение съемного жесткого диска к компьютеру с помощью кабеля USB похоже на схему работы DAS.

DAS-хранилище имеет в своем составе блок питания, систему охлаждения и RAID-контроллер — это помогает системе работать лучше.

Какие преимущества имеет DAS:

  • хранилище легко настраивать и администрировать,
  • высокая производительность,
  • сравнительно низкая стоимость.

Также DAS имеет два недостатка:

  • реализуема только на выделенном сервере,
  • количество подключений ограничено: не более двух серверов.

Как выбрать подходящую СХД

При выборе системы хранения данных стоит опираться на пять параметров:

  1. Формат данных. Для каждого типа данных подходят разные типы СХД. Например, архитектура СХД для работы с крупными медиафайлами будет отличаться от сервера с неструктурированными данными.
  2. Объем диска. При выборе размера дискового пространства также стоит опираться на тип и объем данных: в некоторых случаях может потребоваться несколько терабайт пространства, а иногда хватит и недорогого SSD.
  3. Производительность. Для выбора сервера с подходящей производительностью стоит определить, какую нагрузку должен выдерживать ваш проект.
  4. Отказоустойчивость. Необходимо рассчитать, в какую сумму обойдется потеря данных за определенный отрезок времени. Это поможет избежать лишних затрат на резервное копирование.
  5. Оборудование. После того как вы определили системные требования вашего проекта, выберите оборудование. Возможно, вам потребуется мощный физический сервер, а может, и сравнительно недорогой вариант.

Подведем итоги: все популярные типы архитектуры и сетевого доступа СХД полезны, однако при выборе подходящего решения стоит сфокусироваться на типе данных и системных требованиях проекта. Если вы находитесь в поиске подходящего оборудования, можете выбрать готовую конфигурацию на странице Аренда выделенного сервера или заказать индивидуальное решение через форму «Подбор сервера специалистом».

Отличные VPS на NVMe-дисках и бесплатный тестовый период 3 дня!

Выбрать тариф