Идентификация событий в СМИ
Январь, 2019 год.Собственное решение Сбербанка для мониторинга информации о контрагентах и поиска лидов в интернете.
Какую проблему решали
Система мониторинга СМИ основана на возможностях искусственного интеллекта и облачных технологий.
Для поиска компаний в новостях разработана модель ELMo + BiLSTM + CRF, которая ищет именные сущности — слова и фразы, которыми описывают компании. Далее разделяет названия и атрибуты компании, фильтрует по категориям, приводит в начальную форму (именительный падеж), сверяет со словарем. Для исключения омонимии анализирует организационно-правовую форму, регион, ИНН (при упоминании), бенефициаров, локацию, вид деятельности, объекты (для застройщиков).
Для поиска определенных событий в новостях разработана модель ELMo + Attention.
Бизнес-процесс
До проекта:
- Ручной мониторинг СМИ.
- Длительный процесс поиска информации.
- Низкая вероятность своевременной идентификации важного события.
- Высокие операционные и кредитные риски.
После проекта:
- Автоматический мониторинг более 3,5 млн новостей ежемесячно.
- Сканирование новостного фона каждые 5 минут.
- Перевод с 90 языков.
- Быстрое реагирование на негативную информацию.
- Сокращение потерь за счет своевременной идентификации проблемных кейсов.
Результаты
Команда проекта
Похожие кейсы
AI-кейсы с доказанной бизнес-эффективностью. Все проекты успешно прошли проверку комиссией из признанных экспертов в технологиях и бизнесе.