30 / 04 / 2026
Lakehouse или DWH: как выбрать архитектуру под реальные нагрузки и бюджеты

Разбираем недостатки, скрытые затраты и критерии, которые действительно важны для бизнеса.

Когда речь заходит о построении корпоративного хранилища данных, многие компании оказываются перед дилеммой: идти по проверенному пути классического DWH (Data Warehouse, хранилище данных) или выбрать современный Lakehouse (единая платформа для хранения, обработки и анализа всех типов данных), который обещает «все и сразу». Аргументы обеих сторон подкреплены маркетингом, но реальность, как всегда, оказывается сложнее.

В последние годы рынок данных переходит от авральных импортозамещений и эйфории новых технологий к максимальному прагматизму при выборе архитектуры для работы с информацией. Как показывают мировые исследования, ни одна архитектура не является универсальной, а цена ошибки здесь особенно высока — не зря хранилище называют сердцем бизнеса.

В этой статье разберемся со сложными вопросами, объемами и нагрузками, бюджетными ограничениями, зрелостью команды и самыми последними трендами, которые уже в 2026 году меняют ландшафт в области работы с данными в корпорациях.

Рынок Lakehouse: глобальный масштаб и российские реалии

Прежде чем погружаться в технические и организационные аспекты, стоит оценить масштаб явления. Мировой рынок Lakehouse демонстрирует отличный потенциал: в 2024 году он оценивался в 11,9 млрд долларов США, а затем ожидался рост с 14,2 млрд (2025 год) до 105,9 млрд (2034 год) с темпом +25% ежегодно.

Аналитики определили для этого несколько ключевых причин:

  • стремительное увеличение объемов корпоративных данных;
  • внедрение аналитики на основе искусственного интеллекта;
  • возрастающие потребности в аналитике данных, доступной в режиме реального времени.

В России ситуация схожая, но с локальными поправками на административные ограничения. Важная специфика: с уходом западных вендоров российский рынок активно формирует собственные технологические тренды. Если в США и Европе Lakehouse уже входит в корпоративный стандарт, то нам локально важно учесть доступность решений и специалистов, нормативные требования и будущую миграцию на отечественное ПО.

От маркетинга к реальности: как Lakehouse прошел через «яму разочарования»

У любой инновации есть свой срок жизни, Gartner описывает его с помощью цикла технологического хайпа. Удивительно, но в 2024 году Lakehouse переместилась в «яму разочарований» (на пике она была в 2021–2022 годах), соответственно, к 2026 году должна выйти уже на плато эффективности. То есть фаза шумихи закончилась, и началось практическое внедрение и обкатка. По сути, это не потеря актуальности, а переход к совершенно другим вопросам — «как масштабировать архитектуру, эффективно управлять ею и извлекать инсайты, которые будут двигать бизнес вперед?»

Lakehouse была на пике в 2021–2022 годах, именно тогда Databricks активно продвигали технологию, аналитики и эксперты писали о ней восторженные статьи. И рынок поверил, что классические DWH потеряли актуальность.

Концепция Lakehouse обещала:

  • ACID-транзакции в объектных хранилищах;
  • производительность BI на уровне DWH;
  • единую обработку батчей и стриминга;
  • экономию за счет конвергенции;
  • безболезненную эволюцию схемы данных.

На самом деле часть обещаний сбылась, но не бесплатно. ACID-транзакции действительно заработали (ритейл-компании обрабатывают по 500 млн транзакций в день через Delta Lake). Однако «расходы на вычисления часто растут вместо экономии», а проекты сталкиваются с неожиданными задержками и проблемами производительности.

Сравнительный анализ DWH и Lakehouse по ключевым параметрам

1. Производительность и бенчмарки

Бенчмарки UC Berkeley (LHBench) показывают, что при определенных сценариях Delta Lake дает улучшение производительности в 7–20 раз для больших наборов файлов по сравнению с традиционными подходами.

Microsoft также утверждает, что более 56% организаций ожидают снижения затрат на аналитику более чем на 50% при внедрении Lakehouse в 2025 году.

Однако из коробки Lakehouse не всегда работает быстро в рамках определенного сценария. Бенчмарки часто не соответствуют типам данных конкретной компании.

2. Требовательность к инфраструктуре и данные

Параметр

DWH Lakehouse
Стоимость хранения Высокая (проприетарные форматы) Дешевое объектное хранилище (S3, OSS)
Масштабирование Вертикальное, дорогое Горизонтальное, эластичное
Структура данных Только структурированные Структурированные + JSON + видео + аудио
ACID Нативная Через Iceberg, Delta Lake
Vendor Lock-in Жесткий Низкий, открытые форматы

Становится ясно: классическое DWH не способно обрабатывать лавинообразно растущие неструктурированные данные (видео, аудио, логи IoT). Если ИИ-моделям нужны мультимодальные данные — выбор практически предопределен. Но если у бизнеса стандартная управленческая отчетность и небольшие объемы данных, архитектура DWH будет проще, быстрее и дешевле для старта.

Новый ландшафт 2025–2026: зачем копать глубже

Тренды на 2026 год, по данным аналитиков Gartner и McKinsey, выходят далеко за рамки простого выбора «DWH или Lakehouse». Взгляните на этот ландшафт — он определяет, на чем строить свою стратегию:

  • AI-Ready Data — ИИ-соревнование выигрывает не тот, у кого лучше модели, а тот, у кого качественнее и доступнее данные. Без сильного фундамента ИИ-проекты обречены на провал.
  • Data Mesh — это организационная модель, а не технология. Она передает владение информации бизнес-доменам, делая данные «продуктом». Требует культурных изменений в компании.
  • Data Fabric — архитектурный слой, который интеллектуально связывает все ваши разнородные источники через активные метаданные, автоматизацию и наблюдаемость. Это не «замена» вашей старой системы, а ее улучшение.
  • Гибридные модели — мир движется к гибкой композиции. DWH для отчетности, Data Lake для неструктурированных данных, внедрение ИИ для инференса. У каждого инструмента свое место, и это норма.
  • Data Governance — управление данными выходит на первое место, особенно в свете GDPR (General Data Protection Regulation, общий регламент по защите персональных данных) и этичных требований к ИИ.

Как это работает на практике

Data Mesh предлагает передать ответственность за качество данных самим бизнес-подразделениям (маркетингу, логистике), а не держать это бремя на плечах одного центрального отдела аналитики.

Data Fabric — это технологическая надстройка, которая использует активные метаданные для автоматического управления качеством, происхождением данных и контролем доступа.

Но самое важное: ведущие эксперты из Gartner уже несколько лет призывают прекратить бесполезный спор «Data Mesh vs Data Fabric», потому что это не конкурирующие подходы, а взаимодополняющие фреймворки. Fabric — это архитектура, а Mesh — модель управления. Их можно и нужно использовать вместе.

Искусственный интеллект, все активнее внедряемый в бизнес-процессы, также становится новым требованием к архитектуре данных.

Data Governance: когда архитектура встречается с юристами и ИИ

В условиях современного регулирования (GDPR и набирающего обороты EU AI Act, комплексный закон об искусственном интеллекте, вступивший в силу 01.08.2024) выбор архитектуры становится не только инженерной, но и юридической задачей. Согласно исследованиям, почти 70% организаций сталкиваются с проблемами унифицированного управления данными, что ведет к утечкам и провалам в аналитике.

Системы, построенные на Data Fabric, централизуют управление метаданными, обеспечивая прозрачное происхождение информации и упрощая соответствие GDPR. А Data Mesh, децентрализуя ответственность, позволяет командам быстрее реагировать на требования права на забвение или исправление. Хорошо управляемое озеро данных дает унифицированный доступ к проверенным источникам, ускоряет инсайты и обеспечивает надежный комплаенс.

Поэтому если бизнес работает в жестко регулируемой индустрии (финтех, ретейл, телеком), его цель — Governance by Design (метод обеспечения качества данных, интегрированный в производственный ИТ-цикл). Но Lakehouse при этом требует управления каталогами и качеством гораздо строже, чем DWH с принципом, что данные должны соответствовать заранее определенной структуре перед их сохранением.

Практические критерии выбора: сценарии вместо конкуренции

Итак, как же принять решение с учетом всех этих трендов? Мы не видим конфликта архитектур, а скорее сценарии использования.

На смену бинарной позиции «либо DWH, либо Lakehouse» пришло понимание того, что зрелая организация почти никогда не живет в рамках одной технологической догмы. Ее инфраструктура многослойна.

Важно помнить, что внедрение Lakehouse — это не просто установка нового ПО. Это изменение архитектуры, требующее глубокого понимания внутренней логики. Специалистов по Lakehouse на рынке меньше, они дороже и сложнее в поиске. Для российских компаний к этому добавляется фактор импортозамещения — миграция с западных решений на отечественные платформы требует дополнительной экспертизы и ресурсов.

Кейс: как выбирали архитектуру для HOFF

В прошлом году НОРБИТ совместно с «Хофф Тех» обеспечили переход российской сети гипермаркетов мебели и товаров для дома Hoff на современное хранилище корпоративных данных (КХД). Для организации КХД была выбрана MPP-система Arenadata DB.

В результате более чем на 30% снизились затраты на поддержку старого КХД за счет консолидации данных и отказа от дублирующих систем.

Ключом к успеху стало трехмесячное исследование. Вместо того чтобы поддаваться моде или консерватизму, команда:

  • проанализировала реальные бизнес-задачи;
  • оценила текущий ландшафт данных и компетенции команды;
  • взвесила риски и возможности будущего развития.

В результате осознанно выбрали классическую централизованную архитектуру DWH на базе Arenadata DB. Потому что это соответствовало конкретным сценариям:

  • централизованная аналитическая функция;
  • хорошо структурированные данные;
  • приоритет скорости разработки над гибкостью схемы.

Вместо вывода: готовимся к 2026-му

Эволюция архитектур данных не стоит на месте. Если в 2021 году все спорили, жив ли DWH, то в 2025-м мы видим конвергенцию подходов. Но на горизонте уже новый технологический вызов — агентный ИИ, где агенты-помощники действуют как полноценные пользователи данных. Какие требования это предъявит к архитектуре — тема отдельного исследования.

Однако, что бы ни случилось, дорожная карта для бизнеса остается неизменной:

  • Начните с бизнес-целей и сценариев использования. Не выбирайте архитектуру «потому что это модно».
  • Проведите глубокое предпроектное обследование. Одной встречи недостаточно. Оцените команду, данные, риски и потенциал роста.
  • Стройте гибкую, многослойную архитектуру. Готовьтесь к внедрению ИИ, данных нового типа и новых моделей управления.
  • Не бойтесь начинать с малого (DWH), если это соответствует вашим сегодняшним задачам. Двигайтесь к Lakehouse эволюционно, по мере зрелости.
  • Инвестируйте в governance с самого начала. Это окупится, когда к данным подключатся юристы и ИИ-инспекторы.

Нет единственно правильного ответа на дилемму «Lakehouse или DWH». Есть ваш бизнес, ваши данные и ваша команда. Наша задача — помочь вам сделать осознанный выбор, соответствующий вашим реальным нагрузкам и бюджетам.

Приходите обсудить именно ваш сценарий — оставьте заявку на сайте или напишите на электронную почту info@norbit.ru.


Читайте далее
15 / 04 / 2026 Ошибки внедрения Битрикс24, о которых молчат другие подробнее
17 / 03 / 2026 Переход на ЭПД как ИТ-проект подробнее
05 / 03 / 2026 Начало работы с системой управления взаимоотношениями с клиентами (CRM): как получить результат за 10 дней подробнее
Подпишитесь на наш блог
Бесплатная консультация

Оставьте заявку и мы проведем бесплатную консультцию и ответим на ваши вопросы

Оставьте заявку, и мы свяжемся с вами

или свяжитесь с экспертами НОРБИТ по телефону +7 495 787-29-92 или эл. почте info@norbit.ru

скачать исследование
Оставьте заявку, и мы свяжемся с вами

или свяжитесь с экспертами НОРБИТ по телефону +7 495 787-29-92 или эл. почте info@norbit.ru

Отправьте резюме, и мы свяжемся с вами

или свяжитесь с HR экспертами

по телефону +7 495 787-29-92 или эл. почте info@norbit.ru

Прикрепить файл (DOC, DOCX, PDF, не более 5 мб)
Спасибо!

Благодарим за обращение. Ваша заявка принята

Наш специалист свяжется с Вами в течение рабочего дня
Спасибо!

Ваш запрос на рассылку принят.

Теперь вы всегда будете в курсе наших новостей
Спасибо!

Резюме отправлено.

Наш специалист свяжется с Вами в течение рабочего дня
Нажмите «Принимаю», если соглашаетесь с условиями обработки cookie и ваших персональных данных. Запретить обработку cookie можно в настройках своего браузера. Для оценки эффективности сайта мы используем Яндекс.Метрику. Подробности в Политике обработки ПД