8010

Автоматическая верификация категории продавцов

2021 год.

Проверка типов торговых точек с помощью автоматизированного парсинга их сайтов

alt

Какую проблему решали

Каждый клиент сервиса эквайринга Сбера предварительно подает заявку с указанием вида своей деятельности. Эта информация содержится в коде типа торговой точки, MCC, состоящем из четырех цифр. Каждый MCC проверялся менеджером вручную, что увеличивало срок рассмотрения каждой заявки. Для верификации кода требовалось посетить сайт потенциального партнера сервиса и удостовериться, что MCC присвоен правильно.
Торговые точки, решившие присоединиться к сервису эквайринга Сбера, теряли время, а, значит, и прибыль в ожидании результатов рассмотрения заявки, на обработку которой уходило до 10 дней.
Решение проблемы
Для автоматизации проверки и исправления неверных MCC Сбер разработал набор моделей и алгоритмов машинного обучения.
Внедренное решение точно и быстро определяет код типа торговой точки, используя многофункциональный парсер сайтов магазинов и классификацию на основе искусственного интеллекта.
Это позволило снизить расходы на персонал, ускорить рассмотрение заявок от партнеров, увеличить точность определения MCC и увеличить прибыль.
Применяемые технологии
Ядро системы верификации кода типа торговой точки – технологии NLP (Natural Language Processing) по работе с текстом. Информация с сайта заявителя парсится и обрабатывается в несколько этапов. Слитный текст разделяется, служебные символы верстки удаляются, как и стоп-слова, текст переводится в нижний регистр, после чего подвергается лемматизации, то есть переводу слов в их словарную форму.
Обработанный текст переводится в векторное представление, и это позволяет классифицировать его в разрезе группы кодов и на финальном этапе – самого кода MCC.

Бизнес-процесс

До проекта:

  • Партнер отправляет в сервис эквайринга Сбера заявку на подключение
  • В заявке содержится код типа торговой точки (MCC)
  • Каждую заявку вручную обрабатывает менеджер Сбера, проверяя, в том числе, верность заполнения поля MCC
  • После верификации данных принимается решение по заявке

После проекта:

  • Код MCC в заявке проверяется системой Сбера в автоматическом режиме
  • Сайты компаний-заявителей анализируются с помощью технологий NLP
  • Решение от Сбера автоматически определяет Код MCC с точностью до 81%

Результаты

Команда Сбер (MCC)

Александра Залипаева
Владелец продукта
Егор Морозов
Data scientist