4786

Идентификация событий в СМИ

Январь, 2019 год.

Собственное решение Сбербанка для мониторинга информации о контрагентах и поиска лидов в интернете.

alt

Какую проблему решали

Ежедневный мониторинг СМИ и анализ данных новостных агрегаторов проводится вручную.
Сотрудники ищут в открытых источниках информацию, на основе которой можно сделать вывод о финансовой устойчивости компаний.
84% важных сведений пропускаются или выявляются несвоевременно.
Решение проблемы
Система мониторинга российских и иностранных СМИ ищет информацию о компаниях и их окружении, формирует структурированное досье, анализирует отраслевые новости и их влияние на бизнес, следит за ключевыми событиями (отзыв лицензий, банкротства и т.д.).
Сотрудник банка анализирует отобранные и ранжированные по степени важности новости. В случае выявления значимых для финансовой устойчивости заемщика сведений, оценивается возможность компании выполнять свои обязательства перед банком.
Дополнительно система ищет лиды для банка: анализирует новости о развитии компаний и выявляет потребности в финансировании. Информация передается клиентскому менеджеру для подготовки коммерческого предложения.
Применяемые технологии

Система мониторинга СМИ основана на возможностях искусственного интеллекта и облачных технологий.

Для поиска компаний в новостях разработана модель ELMo + BiLSTM + CRF, которая ищет именные сущности — слова и фразы, которыми описывают компании. Далее разделяет названия и атрибуты компании, фильтрует по категориям, приводит в начальную форму (именительный падеж), сверяет со словарем. Для исключения омонимии анализирует организационно-правовую форму, регион, ИНН (при упоминании), бенефициаров, локацию, вид деятельности, объекты (для застройщиков).

Для поиска определенных событий в новостях разработана модель ELMo + Attention.

Бизнес-процесс

До проекта:

  • Ручной мониторинг СМИ.
  • Длительный процесс поиска информации.
  • Низкая вероятность своевременной идентификации важного события.
  • Высокие операционные и кредитные риски.

После проекта:

  • Автоматический мониторинг более 3,5 млн новостей ежемесячно.
  • Сканирование новостного фона каждые 5 минут.
  • Перевод с 90 языков.
  • Быстрое реагирование на негативную информацию.
  • Сокращение потерь за счет своевременной идентификации проблемных кейсов.

Результаты

Команда проекта

Виталий Кадулин
Главный инженер по разработке
Анна Капылова
Руководитель направления
Антон Марченков
Исполнительный директор
Руслан Нагуманов
Главный инженер по разработке
Фидель Чатуев
Исполнительный директор
Михаил Шевцов
Директор дивизиона
Екатерина Шиповалова
Руководитель проектов