Новое поколение DBaaS под новые вызовы: производительность выделенного сервера для MPP, Big Data и ML
Объемы данных растут, и перед заказчиками стоит вопрос, где их размещать, чтобы не потерять в производительности. On-premise инфраструктура обходится недешево и требует столь дефицитных профильных специалистов. А возможности облаков могут быть ограничены по объему размещаемых там баз данных и по их производительности. Создавать распределенные базы данных сложно и дорого. Но решение есть — запуск баз данных на выделенном сервере, уверен Александр Гришин, менеджер DBaaS-продуктов Selectel.
CNews: Вы первые, кто запустил DBaaS на выделенных серверах. Для кого актуальна эта услуга?
Александр Гришин: Мы создаем любой сервис с позиции jobs to be done — работа, которая должна быть выполнена. То есть наш сервис должен решить проблему клиента, «выполнить работу» для него. Мы не придумываем что-то, навязывая потом это клиентам, а ориентируемся на то, какую задачу индустрия решает прямо сейчас, и потом предлагаем свою помощь.
Сейчас на российском рынке существует только облачный DBaaS. Но при этом есть клиенты, которые осознанно отказываются от облачных баз данных и самостоятельно разворачивают базу данных на выделенном сервере, более подходящим под enterprice профиль нагрузки — высокая производительность и действительно большой объем данных. Поняв эту потребность, мы и запустили DBaaS на выделенных серверах.
CNews: В чем принципиальная разница между DBaaS в облаке и на выделенных серверах?
Александр Гришин: Если представить, что вы заказываете базу данных в облаке, то она будет развернута на сервере провайдера, где могут одновременно работать сотни клиентов. Несмотря на выделение фиксированных ресурсов, таких как CPU, RAM и storage, ваша база данных будет неизбежно конкурировать за остальные ресурсы физического сервера: производительность дисковой подсистемы, шину данных, сетевые интерфейсы, канал и другие компоненты системы.
Второй момент — базы данных крайне чувствительны к множеству «тонких настроек», как на уровне приложения, так и на уровне операционной системы, гипервизора, BIOS и железа. Мы регулярно проводим тесты, которые показывают, как такие параметры, как марка процессора, тип памяти, диск и даже дизайн материнской платы, могут влиять на производительность. В облаке вы не можете кастомизировать эти компоненты из-за того, что на одном сервере работает множество виртуальных машин, и изменения, которые касаются одного клиента, могут повлиять на других.
Возможно, поэтому требовательные заказчики предпочитали развертывать базу данных на выделенном сервере самостоятельно. Теперь мы готовы взять на себя эту работу и сделать ее на высшем уровне, обеспечивая одновременно и преимущества и выделенного сервера, и облака.
CNews: Обычно, арендуя выделенный сервер Dedicated, клиент получает его пустым, выполняя все настройки самостоятельно. Как обстоят дела в случае DBaaS? Кто настраивает БД?
Александр Гришин: Заказать выделенный сервер под базу данных — задача не такая простая, как может показаться на первый взгляд. Во-первых, нужно правильно выбрать сервер. Как я уже упоминал, базы данных крайне чувствительны к аппаратным компонентам, даже для выбора нужна серьезная экспертиза.
У нас в Selectel есть целый отдел, который круглый год 24х7 занимается тестированием оборудования под различные задачи. Мы также предоставляем инструмент на сайте, который помогает выбрать подходящий сервер для конкретной базы данных, так что мы всегда готовы помочь нашим клиентам на этом этапе.
После выбора сервера и комплектующих необходимо провести его настройку. Например, требуется настроить BIOS и ОС для получения максимальной производительности СУБД. Для обеспечения отказоустойчивости кластера требуется настройка репликации, и тут возникают свои сложности. Например, для PostgreSQL невозможна простая настройка реплик «из коробки» — вокруг него необходимо строить целую систему обеспечения высокой доступности. Также потребуется настройка системы мониторинга. Обязательный этап — настройка системы резервного копирования и восстановления, а это еще одна информационная система, которую придется обслуживать самостоятельно.
Безопасность базы данных — это важный аспект. В Selectel уже есть все необходимые сертификаты соответствия, такие как 152-ФЗ (УЗ-1), ФСТЭК № 21, PCI DSS 4, ISO 27001, 27017, 27018, ГОСТ Р 57580. Если клиент решит настроить базу данных самостоятельно, ему нужно будет привлекать стороннюю компанию для проведения аудита и получения аттестата соответствия, а это может занять до полугода и обойтись в семизначные суммы.
CNews: В каких проектах это может потребоваться?
Александр Гришин: Мы запустили услугу DBaaS на выделенных серверах этим летом, и уже сейчас у нас есть несколько примеров, которые хорошо демонстрируют, когда такой сервис действительно необходим.
Первый кейс — это онлайн-магазин, который не готов вкладываться в создание собственной ИТ-экспертизы. Уже более трех лет он использует наш облачный сервис DBaaS. Однако база данных магазина быстро растет и скоро достигнет 5 Тб. Это довольно много, и в обычном облаке бы требовало шардирования и доработки со стороны приложения, которую коллеги делать не готовы. В итоге наша новая услуга решила проблему клиента.
Второй кейс находится в стадии миграции от другого облачного провайдера: компания занимается аналитикой и визуализацией данных из более чем 10 источников (PostgreSQL, MySQL, ClickHouse, S3, HDFS). База данных действительно большая - >13 ТБ, и стандартные облачные решения просто не подходят. При этом инсталляция распределенной базы данных с MPP — это катастрофически дорогое решение, что на корню перечеркивает всю экономику этого проекта. В этом случае наша услуга «база данных на выделенном сервере» явилась идеальным решением.
Третий кейс — SaaS-платформа, онлайн-конструктор для создания сайтов. Коллеги пытались размещать базу данных в известном зарубежном облаке, однако производительность не отвечала их профилю нагрузки. В этот момент на них вышли мы и начали пилотный проект.
Разумеется, клиент остался доволен нашим решением.
Последний пример с похожей проблемой решала и известная компания из индустрии GameDev. Они начали с конкурирующего нам облачного решения, но обнаружили, что при размерах данных более 1 ТБ вся информационная система работает крайне медленно. Перевод на нашу новую услугу позволил им достичь нужной производительности и продолжить развитие проекта с прогнозируемым ростом данных в одной базе до 15 ТБ.
CNews: Расскажите про дополнительные сервисы в рамках DBaaS на выделенных серверах.
Александр Гришин: Наш новый сервис является частью облачной платформы Selectel, которая подразумевает полный набор взаимосвязанных и интегрируемых между собой сервисов, что позволяет реализовать ИТ-инфраструктуру любой сложности. Например, у наших клиентов есть возможность развернуть кластеры Managed Kubernetes, подключить виртуальные машины, объектное хранилище или CDN, если нужно связать эндпоинты через глобальный роутер или балансировщики. В целом, нашу новую услугу можно использовать со всеми сервисами Selectel.
CNews: Какие еще платформенные сервисы, кроме DBaaS, пользуются спросом у заказчиков?
Александр Гришин: DBaaS Selectel часто используется вместе с kubernetes, DAVM, DSVM и ML-платформами. Частый кейс использования DBaaS вместе с объектным S3-хранилищем и файловым хранилищем.
Также для хранения мы предлагаем три типа СХД: ленточные библиотеки, выделенные СХД и даже шареный LUN.
CNews: Как вы видите дальнейшее развитие DBaaS? Какие тренды и новшества ожидать на горизонте 1-2 лет и куда все может прийти через 5-10 лет?
Александр Гришин: Данные — это новая нефть, и я четко вижу, что их становится все больше с каждым годом. Еще недавно трендом было использовать данные для принятия управленческих решений, а сами они измерялись терабайтами.
Сегодня мы видим тренд на оцифровку знаний, навыков, ноу-хау и прочей деятельности человека. Данные повсеместно используются для обучения ML-моделей. Размеры данных теперь выросли до петабайтов. Также новым трендом стали действительно мощные, распределенные compute системы с MPP (massively parallel processing) архитектурой.
В контексте этой реальности для нас сейчас есть два основных направления развития.
- Первое — распределенные базы данных, в том числе в партнерстве с производителями специализированного ПО.
- Второе — высокопроизводительные базы данных на выделенном сервере, которые я сегодня вам презентовал.
В перспективе 5 лет мы планируем развивать оба этих направления.
■ erid:2W5zFG38PdiРекламодатель: АО «Селектел»ИНН/ОГРН: 7810962785/1247800067790Сайт: https://selectel.ru/