2840

Ускорение обработки ипотечных заявок

Май, 2020 год.

Извлечение данных из документов для быстрого одобрения ипотечного кредита от команды ДомКлик от Сбера.

alt

Какую проблему решали

Обработка заявок на ипотеку проводится вручную и занимает 2 часа.
Сотрудники тратят время на проверку и возврат документов с ошибками, а также на ввод данных из них в систему для кредитного анализа.
Заявители не могут сразу узнать, приняты ли документы.
Решение проблемы
Для ускорения процесса решено автоматизировать работу с .
Решение на основе искусственного интеллекта проверяет качество загружаемых фотографий и корректность документов, самостоятельно переносит данные из них в систему для кредитного анализа.
При наличии ошибок пользователь узнает об этом мгновенно и может сразу заменить файлы.
Применяемые технологии

Разработана комплексная система классификации, распознавания и поиска дефектов в документах.

Использованы:

  • Сверточная нейронная сеть для работы с различными классами ошибок
  • Библиотеки PyTorch/TensorFlow для распознавания текста
  • Библиотека Kenlm для языковых моделей
  • Библиотека Scikit-learn для проверки распознавания
  • Алгоритмы AI: MLP, Seq2seq, LSTM, GRU, DCNN, Logistic regression, Ridge/lasso Regression

Датасет для машинного обучения собирали и размечали вручную на основе имеющегося документопотока.

Система постоянно мониторит работоспособность и качество моделей. В случае увеличения/уменьшения дефектов, появления жалоб от клиентов, проводится разбор и, при необходимости, корректировка модели.

Бизнес-процесс

До проекта:

  • 50% заявок проверяется вручную.
  • До 17 минут на проверку документов и ручной ввод данных.
  • 2 часа с момента подачи заявки до внесения ее в систему (включая ожидание в очереди).

После проекта:

  • 76% заявок обрабатываются без участия сотрудников.
  • 17 секунд на обработку документов и ввод данных.
  • Заявка поступает в работу сразу, без очередей.

Результаты

Команда проекта

Андрей Белов
Руководитель направления по исследованию данных
Андрей Дубровин
Технический руководитель разработки
Александр Коротков
Исполнительный директор
Алексей Кузьмин
Исполнительный директор по исследованию данных
Мария Молчанова
Специалист по работе с данными
Евгений Орлов
Ведущий исследователь данных
Кристина Ракова
Руководитель направления по исследованию данных
Дарья Ройчикова
Исследователь данных
Никита Семенов
Главный инженер по разработке