3198
Анализ клиентских чеков с помощью AI
2021 год.Как обработка чековых данных помогает лучше понимать потребности клиента
Какую проблему решали
Каждый из 100+ миллионов клиентов Сбера имеет уникальный опыт взаимодействия с продуктами банка и экосистемы. Сбер стремится найти индивидуальный подход к каждому клиенту и максимально точно персонализировать свои предложения, применяя широкий спектр наборов данных.
Транзакции в магазинах – один из ценных источников сведений о предпочтениях клиентов, однако просто знать сумму покупки и наименование продавца – недостаточно.
Чтобы лучше понимать потребности и привычки клиентов, Сбер разработал решение на основе AI, позволяющее извлекать и обрабатывать детальные данные из чеков.
Решение проблемы
Платформа чеков была разработана и пропилотирована Сбером в 2021 году. Построенное на основе алгоритмов AI решение умеет автоматически распознавать и распределять купленные клиентом товары более чем по 72 тыс. параметрам – например, по категориям, брендам, продуктам, единицам измерения. Точность распознавания – 85%. Такой результат позволяет командам Сбера использовать полученные из фискальных чеков знания о клиентах для реализации большинства бизнес-кейсов.
Также по результатам пилота подтвердилась возможность использования данных из чеков при проведении маркетинговых кампаний, формировании персональных рекомендаций и оценке рисков при выдаче кредитов.
Применяемые технологии
Модель на основе нейросетей обучена решать ряд нетривиальных задач: обрабатывать огромный объем данных из чеков, учитывая разнообразие названий продуктов (в том числе составные), опечатки, транслитерацию, сокращения и аббревиатуры в наименованиях чеков.
Команда проекта применила модель глубокого обучения BERT для решения задачи классификации текста (CLS) и выделения именованных сущностей (NER). В качестве отправной точки была использована модель RuBERT (12 слоев, размерность скрытого слоя 768, 12 голов, 180M параметров), которая впоследствии была дообучена на задаче генерации пропущенного токена (MLM).
Система использует маскированные языковые модели с механизмами Self-Attention («внимание на себя») и архитектуры Transformer, трансферное обучение и др. Эти технологии позволяют создавать эффективные решения для автоматического анализа данных на естественном языке.
Команда проекта применила модель глубокого обучения BERT для решения задачи классификации текста (CLS) и выделения именованных сущностей (NER). В качестве отправной точки была использована модель RuBERT (12 слоев, размерность скрытого слоя 768, 12 голов, 180M параметров), которая впоследствии была дообучена на задаче генерации пропущенного токена (MLM).
Система использует маскированные языковые модели с механизмами Self-Attention («внимание на себя») и архитектуры Transformer, трансферное обучение и др. Эти технологии позволяют создавать эффективные решения для автоматического анализа данных на естественном языке.
Бизнес-процесс
До проекта:
- Банк собирает транзакционные данные клиента
- Данные обрабатываются ML-моделями
- Система составляет персональные рекомендации для клиента
- Точные предпочтения клиентов остаются неизвестными для банка
После проекта:
- Клиент дает банку согласие на получение и использование данных о своих покупках из чеков
- Банк выделяет из чеков состав покупок, предпочитаемые бренды и другие сведения
- Банк получает возможность максимально персонализировать предложения и использовать полученные знания о клиентах для развития продуктов
Результаты
Команда Сбер "Массовая персонализация"
Эдуард Гатауллин
Руководитель направления
Антон Золотухин
Data Protection Officer
Максим Красавин
Исполнительный директор
Анна Махова
Руководитель направления
Похожие кейсы
AI-кейсы с доказанной бизнес-эффективностью. Все проекты успешно прошли проверку комиссией из признанных экспертов в технологиях и бизнесе.