Альтернативная оценка численности населения России
2020 — 2021 гг.ML-модель оценки численности населения от «СберАналитика» в рамках проведения Всероссийской переписи населения.
Какую проблему решали
Ансамбль моделей с сильной обобщающей способностью построен на основе алгоритма «Градиентный бустинг на деревьях решений» и нейросетей.
Система учитывает агрегированную обезличенную информацию о количестве жителей муниципалитета и их финансовых потоках из банковской CRM, информацию Центрального Банка, материалы ЗАГС, открытые коэффициенты, характер и уровень урбанизации муниципалитета.
Обучающая выборка основана на данных «Росстат» за 2010-2020 гг. Модель строится независимо для каждого региона страны, кроме моделируемого.
Бизнес-процесс
До проекта:
- Росстат проводит Всероссийскую перепись 1 раз в 10 лет. В промежутке между переписями информация устаревает, прогнозы строятся без учета актуальной информации.
- Принимаемые государственные и бизнес-решения опираются на неточные данные. Это приносит убытки и не позволяет планировать эффективные долгосрочные программы.
После проекта:
- Статистические отчеты по каждому субъекту государства учитывают актуальную информацию о численности населения, банковской активности и данные ЗАГС.
- Модель собирает точные данные о численности населения, которые улучшают эффективность планирования на отдельных территориях и в государстве.
Результаты
Команда «СберАналитика»
Команда Росстата
Похожие кейсы
AI-кейсы с доказанной бизнес-эффективностью. Все проекты успешно прошли проверку комиссией из признанных экспертов в технологиях и бизнесе.