Качество корпоративных данных напрямую влияет на эффективность бизнеса. Особенно остро эта проблема стоит при работе с нормативно-справочной информацией (НСИ), а именно — со справочниками материально-технических ресурсов (МТР). Дубли, неточности, неактуальные данные и разный формат описания одного и того же товара в разных системах приводят к затариванию складов, нехватке нужных позиций и, как следствие, к прямым убыткам.
Можно ли превратить НСИ из источника проблем в надежный актив компании? Да, если объединить мощь
Проблема: физический мир и его цифровые двойники
Физический мир, например, простая бутылка с водой, в разных корпоративных системах может быть описан десятками способов. Это несоответствие ведет к хаосу: дублированию, неверной классификации, отсутствию важных характеристик.
Последствия такого беспорядка для бизнеса далеко не безобидны и влияют сразу на несколько направлений. Так, одни и те же позиции могут закупаться повторно под разными названиями, что ведет к затовариванию складов неликвидами, в то время как действительно нужные материалы оказываются в дефиците. Из-за отсутствия четкой классификации снабженцы тратят часы на поиск аналогов или, не найдя их, совершают избыточные закупки.
Страдают финансовый блок, отчетность и аналитика. Разрозненные данные не позволяют сформировать объективную картину запасов, что делает планирование неточным, а отчеты — недостоверными. Но самый тяжелый груз ложится на плечи сотрудников, огромные трудозатраты на ручную выверку, сверку Excel-таблиц и исправление чужих ошибок становятся их повседневной рутиной, отвлекая от действительно важных задач.
От методологии к нормализации с помощью инновационных инструментов
Путь к качественным данным предваряет два больших этапа: методологический и технический. Прежде чем внедрять алгоритмы, необходимо описать целевую архитектуру справочников, определить их владельцев, регламенты заведения и правила проверки. Только выстроив методологию, можно переходить к автоматизации.
Для технической реализации процессов очистки и обогащения данных в НОРБИТ разработали продукт AI MasterData. Платформа позволяет автоматизировать процесс нормализации НСИ, используя комбинацию классического машинного обучения и больших языковых моделей для распределения номенклатуры по категориям, обогащения атрибутами и устранения дубликатов. AI MasterData использует специализированные алгоритмы для различных ситуаций обработки данных, включая самые сложные задачи: некатегоризированные записи, НСИ с большим количеством ошибок.
Как AI MasterData превращает хаос в порядок
Платформа обрабатывает каждую «сырую» запись, поступающую из систем-источников (например, ERP или SRM) в несколько этапов:
-
Предобработка: алгоритм исправляет орфографические ошибки, убирает лишние знаки, расшифровывает аббревиатуры (например, «подш.» заменяет на «подшипник»), чтобы подготовить запись к дальнейшему анализу;
-
Категоризация: система определяет, к какому классу справочника относится товар. Например, для записи «Подшипник FAC 6305» модель с высокой уверенностью отнесет его к категории «Подшипники»;
-
Извлечение и обогащение атрибутов: ключевой этап. Система «вычитывает» характеристики прямо из названия. Но часто в названии скрыт лишь артикул, за которым стоят важнейшие параметры (диаметр, ширина, тип). В этом случае AI MasterData обращается к базе знаний — предзагруженным каталогам производителей, интернет-справочникам, ГОСТам, чтобы «обогатить» запись полным набором характеристик;
-
Формирование чистого наименования: на основе заполненных атрибутов система автоматически формирует стандартизированное наименование по заданному шаблону.
Важно, что все алгоритмы работают с оценкой достоверности. Если уверенность модели высока (выше заданного порога, например, 0,9), запись утверждается автоматически. Если нет — уходит на проверку к эксперту.
Синергия с MDM: как это работает
AI MasterData — это инструмент для нормализации, а не хранения мастер-данных. Данные должны находиться в отдельной системе, и одно из лучших мест для этого —
Процесс интеграции выглядит следующим образом:
-
Сбор: необработанные записи загружаются в «„БФТ.ЕНСИ“» из Excel или через ETL-сервисы;
-
Нормализация: пользователь запускает процесс, и система отправляет запись в AI MasterData;
-
Возврат: платформа ИИ возвращает в MDM уже классифицированную запись с извлеченными и обогащенными атрибутами;
-
Валидация: в «БФТ.ЕНСИ» настроены специальные правила, если качество данных от ИИ высокое, запись сразу становится эталонной и готовится к распространению в системы-потребители. Если уверенность низкая, запись остается в статусе, требующем ручной доработки экспертом.
Ручная нормализация справочника из 100 тысяч позиций может занимать до 15 месяцев. С этим тандемом технологий процесс сокращается до 30 дней.
Экономический эффект: считаем выгоду
Применение методов генеративного ИИ и машинного обучения позволяет радикально ускорить обработку данных и снизить стоимость этого процесса. Обработка одной записи теперь занимает секунды, до минуты в самых сложных случаях (с поиском в интернете). Себестоимость обработки одной записи составляет порядка 12 рублей против сотен рублей и часов времени при ручном разборе.
Технические детали: безопасность, дообучение и адаптация
При внедрении решения у клиентов, конечно, возникают вопросы, самые распространенные из них:
- Можно ли развернуть решение внутри контура компании?
Да, AI MasterData может работать в закрытом контуре on-premise, без доступа к интернету. В дистрибутив платформы уже загружены необходимые справочные базы.
-
Как быть, если ИИ ошибся, например, отнес
13-дюймовое колесо к грузовым?
Модели дообучаются. На этапе внедрения алгоритмы изучают исторические данные заказчика и подстраиваются под принятую в компании логику. Если ошибка все же произошла, администратор (не разработчик!) может зайти в интерфейс и добавить примеры, скорректировав работу модели.
- Кто нужен для поддержки системы?
Роли data scientist не требуется. Дообучение происходит автоматически или силами бизнес-аналитика. На этапе массового разбора может потребоваться участие экспертов для выборочной проверки, но в стабильном режиме поддержка минимальна.
- Работает ли решение с другими справочниками (контрагенты, ОКОФ)?
Да, платформа применима для любых задач нормализации. Для контрагентов, например, в «БФТ.ЕНСИ» есть возможность автоматического обогащения данных из ЕГРЮЛ/ЕГРИП.
Ключевые выгоды для бизнеса
Синергия
Экономический эффект от наведения порядка в НСИ складывается из нескольких составляющих. Прозрачный учет и отсутствие дублей высвобождают оборотные средства, замороженные в неликвидных запасах. Эффективный подбор аналогов напрямую снижает закупочные цены, а ускорение закупочного цикла повышает операционные результаты. Кроме того, достоверная отчетность снижает риски принятия неверных стратегических решений, что в комплексе обеспечивает устойчивый рост и конкурентоспособность бизнеса.
Хотите проверить, как решение справится с вашими данными? Эксперты НОРБИТ готовы ответить на вопросы и провести пилотный проект на вашей выборке: оставьте заявку на сайте или свяжитесь по электронной почте info@norbit.ru.

