Разбираем недостатки, скрытые затраты и критерии, которые действительно важны для бизнеса.
Когда речь заходит о построении корпоративного хранилища данных, многие компании оказываются перед дилеммой: идти по проверенному пути классического DWH (Data Warehouse, хранилище данных) или выбрать современный Lakehouse (единая платформа для хранения, обработки и анализа всех типов данных), который обещает «все и сразу». Аргументы обеих сторон подкреплены маркетингом, но реальность, как всегда, оказывается сложнее.
В последние годы рынок данных переходит от авральных импортозамещений и эйфории новых технологий к максимальному прагматизму при выборе архитектуры для работы с информацией. Как показывают мировые исследования, ни одна архитектура не является универсальной, а цена ошибки здесь особенно высока — не зря хранилище называют сердцем бизнеса.
В этой статье разберемся со сложными вопросами, объемами и нагрузками, бюджетными ограничениями, зрелостью команды и самыми последними трендами, которые уже в 2026 году меняют ландшафт в области работы с данными в корпорациях.
Рынок Lakehouse: глобальный масштаб и российские реалии
Прежде чем погружаться в технические и организационные аспекты, стоит оценить масштаб явления. Мировой рынок Lakehouse демонстрирует отличный потенциал: в 2024 году он оценивался в 11,9 млрд долларов США, а затем ожидался рост с 14,2 млрд (2025 год) до 105,9 млрд (2034 год) с темпом +25% ежегодно.
Аналитики определили для этого несколько ключевых причин:
- стремительное увеличение объемов корпоративных данных;
- внедрение аналитики на основе искусственного интеллекта;
- возрастающие потребности в аналитике данных, доступной в режиме реального времени.
В России ситуация схожая, но с локальными поправками на административные ограничения. Важная специфика: с уходом западных вендоров российский рынок активно формирует собственные технологические тренды. Если в США и Европе Lakehouse уже входит в корпоративный стандарт, то нам локально важно учесть доступность решений и специалистов, нормативные требования и будущую миграцию на отечественное ПО.
От маркетинга к реальности: как Lakehouse прошел через «яму разочарования»
У любой инновации есть свой срок жизни, Gartner описывает его с помощью цикла технологического хайпа. Удивительно, но в 2024 году Lakehouse переместилась в «яму разочарований» (на пике она была в
Lakehouse была на пике в
Концепция Lakehouse обещала:
- ACID-транзакции в объектных хранилищах;
- производительность BI на уровне DWH;
- единую обработку батчей и стриминга;
- экономию за счет конвергенции;
- безболезненную эволюцию схемы данных.
На самом деле часть обещаний сбылась, но не бесплатно. ACID-транзакции действительно заработали (ритейл-компании обрабатывают по 500 млн транзакций в день через Delta Lake). Однако «расходы на вычисления часто растут вместо экономии», а проекты сталкиваются с неожиданными задержками и проблемами производительности.
Сравнительный анализ DWH и Lakehouse по ключевым параметрам
1. Производительность и бенчмарки
Бенчмарки UC Berkeley (LHBench) показывают, что при определенных сценариях Delta Lake дает улучшение производительности в
Microsoft также утверждает, что более 56% организаций ожидают снижения затрат на аналитику более чем на 50% при внедрении Lakehouse в 2025 году.
Однако из коробки Lakehouse не всегда работает быстро в рамках определенного сценария. Бенчмарки часто не соответствуют типам данных конкретной компании.
2. Требовательность к инфраструктуре и данные
|
Параметр |
DWH | Lakehouse |
|---|---|---|
| Стоимость хранения | Высокая (проприетарные форматы) | Дешевое объектное хранилище (S3, OSS) |
| Масштабирование | Вертикальное, дорогое | Горизонтальное, эластичное |
| Структура данных | Только структурированные | Структурированные + JSON + видео + аудио |
| ACID | Нативная | Через Iceberg, Delta Lake |
| Vendor Lock-in | Жесткий | Низкий, открытые форматы |
Становится ясно: классическое DWH не способно обрабатывать лавинообразно растущие неструктурированные данные (видео, аудио, логи IoT). Если ИИ-моделям нужны мультимодальные данные — выбор практически предопределен. Но если у бизнеса стандартная управленческая отчетность и небольшие объемы данных, архитектура DWH будет проще, быстрее и дешевле для старта.
Новый ландшафт 2025–2026: зачем копать глубже
Тренды на 2026 год, по данным аналитиков Gartner и McKinsey, выходят далеко за рамки простого выбора «DWH или Lakehouse». Взгляните на этот ландшафт — он определяет, на чем строить свою стратегию:
- AI-Ready Data — ИИ-соревнование выигрывает не тот, у кого лучше модели, а тот, у кого качественнее и доступнее данные. Без сильного фундамента ИИ-проекты обречены на провал.
- Data Mesh — это организационная модель, а не технология. Она передает владение информации бизнес-доменам, делая данные «продуктом». Требует культурных изменений в компании.
- Data Fabric — архитектурный слой, который интеллектуально связывает все ваши разнородные источники через активные метаданные, автоматизацию и наблюдаемость. Это не «замена» вашей старой системы, а ее улучшение.
- Гибридные модели — мир движется к гибкой композиции. DWH для отчетности, Data Lake для неструктурированных данных, внедрение ИИ для инференса. У каждого инструмента свое место, и это норма.
- Data Governance — управление данными выходит на первое место, особенно в свете GDPR (General Data Protection Regulation, общий регламент по защите персональных данных) и этичных требований к ИИ.
Как это работает на практике
Data Mesh предлагает передать ответственность за качество данных самим бизнес-подразделениям (маркетингу, логистике), а не держать это бремя на плечах одного центрального отдела аналитики.
Data Fabric — это технологическая надстройка, которая использует активные метаданные для автоматического управления качеством, происхождением данных и контролем доступа.
Но самое важное: ведущие эксперты из Gartner уже несколько лет призывают прекратить бесполезный спор «Data Mesh vs Data Fabric», потому что это не конкурирующие подходы, а взаимодополняющие фреймворки. Fabric — это архитектура, а Mesh — модель управления. Их можно и нужно использовать вместе.
Искусственный интеллект, все активнее внедряемый в бизнес-процессы, также становится новым требованием к архитектуре данных.
Data Governance: когда архитектура встречается с юристами и ИИ
В условиях современного регулирования (GDPR и набирающего обороты EU AI Act, комплексный закон об искусственном интеллекте, вступивший в силу 01.08.2024) выбор архитектуры становится не только инженерной, но и юридической задачей. Согласно исследованиям, почти 70% организаций сталкиваются с проблемами унифицированного управления данными, что ведет к утечкам и провалам в аналитике.
Системы, построенные на Data Fabric, централизуют управление метаданными, обеспечивая прозрачное происхождение информации и упрощая соответствие GDPR. А Data Mesh, децентрализуя ответственность, позволяет командам быстрее реагировать на требования права на забвение или исправление. Хорошо управляемое озеро данных дает унифицированный доступ к проверенным источникам, ускоряет инсайты и обеспечивает надежный комплаенс.
Поэтому если бизнес работает в жестко регулируемой индустрии (финтех, ретейл, телеком), его цель — Governance by Design (метод обеспечения качества данных, интегрированный в производственный ИТ-цикл). Но Lakehouse при этом требует управления каталогами и качеством гораздо строже, чем DWH с принципом, что данные должны соответствовать заранее определенной структуре перед их сохранением.
Практические критерии выбора: сценарии вместо конкуренции
Итак, как же принять решение с учетом всех этих трендов? Мы не видим конфликта архитектур, а скорее сценарии использования.
На смену бинарной позиции «либо DWH, либо Lakehouse» пришло понимание того, что зрелая организация почти никогда не живет в рамках одной технологической догмы. Ее инфраструктура многослойна.
Важно помнить, что внедрение Lakehouse — это не просто установка нового ПО. Это изменение архитектуры, требующее глубокого понимания внутренней логики. Специалистов по Lakehouse на рынке меньше, они дороже и сложнее в поиске. Для российских компаний к этому добавляется фактор импортозамещения — миграция с западных решений на отечественные платформы требует дополнительной экспертизы и ресурсов.
Кейс: как выбирали архитектуру для HOFF
В прошлом году НОРБИТ совместно с «Хофф Тех» обеспечили переход российской сети гипермаркетов мебели и товаров для дома Hoff на современное хранилище корпоративных данных (КХД). Для организации КХД была выбрана MPP-система Arenadata DB.
В результате более чем на 30% снизились затраты на поддержку старого КХД за счет консолидации данных и отказа от дублирующих систем.
Ключом к успеху стало трехмесячное исследование. Вместо того чтобы поддаваться моде или консерватизму, команда:
- проанализировала реальные бизнес-задачи;
- оценила текущий ландшафт данных и компетенции команды;
- взвесила риски и возможности будущего развития.
В результате осознанно выбрали классическую централизованную архитектуру DWH на базе Arenadata DB. Потому что это соответствовало конкретным сценариям:
- централизованная аналитическая функция;
- хорошо структурированные данные;
- приоритет скорости разработки над гибкостью схемы.
Вместо вывода: готовимся к 2026-му
Эволюция архитектур данных не стоит на месте. Если в 2021 году все спорили, жив ли DWH, то в
Однако, что бы ни случилось, дорожная карта для бизнеса остается неизменной:
- Начните с бизнес-целей и сценариев использования. Не выбирайте архитектуру «потому что это модно».
- Проведите глубокое предпроектное обследование. Одной встречи недостаточно. Оцените команду, данные, риски и потенциал роста.
- Стройте гибкую, многослойную архитектуру. Готовьтесь к внедрению ИИ, данных нового типа и новых моделей управления.
- Не бойтесь начинать с малого (DWH), если это соответствует вашим сегодняшним задачам. Двигайтесь к Lakehouse эволюционно, по мере зрелости.
- Инвестируйте в governance с самого начала. Это окупится, когда к данным подключатся юристы и ИИ-инспекторы.
Нет единственно правильного ответа на дилемму «Lakehouse или DWH». Есть ваш бизнес, ваши данные и ваша команда. Наша задача — помочь вам сделать осознанный выбор, соответствующий вашим реальным нагрузкам и бюджетам.
Приходите обсудить именно ваш сценарий — оставьте заявку на сайте или напишите на электронную почту info@norbit.ru.

