1886

Быстрая оцифровка данных для государственных сервисов

Июль, 2020 год.

Распознавание рукописного текста для создания электронного архива документов с помощью платформы Beorg Smart Vision.

alt

Какую проблему решали

В соответствии с требованиями законодательства РФ органам ЗАГС необходимо перевести все документы в электронный формат.
В течение шести месяцев потребовалось оцифровать 1 млн записей актов гражданского состояния Тамбовской области с 1926 по 1999 год. Документы содержали ветхие записи и смазанные печати, без технологий «Биорг» на базе ИИ, c помощью которых распознавание рукописного текста происходит автоматически, понадобилось бы большое количество специалистов с конкретными навыками, организовать работу которых в короткий срок и в условиях пандемии не представлялось возможным.
Важна определенная квалификация специалистов в расшифровке ветхих и нечетких записей, которые велись от руки.
Решение проблемы
Оцифровку документов провела компания «Биорг», используя возможности инновационной платформы Beorg Smart Vision и краудсорсингового сервиса. Это позволило задействовать меньше персонала и решить проблему его квалификации.
Операторы снимают скан-образы актовых записей, которые поступают в систему для распознавания. В сложных случаях документы верифицируются операторами краудсорсингового сервиса «Биорг».

Если возможно, система распознает весь документ. Если нет — происходит декомпозиция на отдельные поля (дата, адрес, фамилия).
Применяемые технологии

Интегрированная онлайн-платформа Beorg Smart Vision на базе искусственного интеллекта — собственная разработка компании «Биорг». Она позволяет работать с различными типами рукописных документов.

В основе платформы — нейросетевые алгоритмы, обученные под конкретные типы задач.

Платформа объединяет следующие технологии:

  • Конвейер обработки материалов
  • Проприетарные алгоритмы обработки источников данных
  • Нестандартные ансамбли специализированных нейросетей
  • Natural language processing для обработки ошибок и автоматизированной классификации сущностей в базе знаний проекта
  • Собственная краудсорсинговая платформа
  • Конволюционно-рекуррентные нейронные сети (CNN + RNN [LSTM]) на базе архитектуры Faster-RCNN глубокого обучения на всех этапах обработки входной информации

Бизнес-процесс

До проекта:

  • Огромные массивы данных в бумажном виде, источниками которых служат актовые книги.
  • Часть книг велась от руки еще 20-е годы прошлого века, поэтому находится в достаточно ветхом состоянии.

После проекта:

  • Досрочно оцифрован 1 млн данных актовых книг.
  • Вся информация о населении области передана в единый государственный реестр записей актов гражданского состояния (ЕГР ЗАГС).

Результаты

Команда ЗАГС Тамбовской области

Ольга Горохова
Начальник управления

Команда «Биорг»

Георгий Зуев
Президент компании
Александр Миронов
Директор направления государственных программ
Александр Новиков
Аналитик IT

Похожие кейсы

AI-кейсы с доказанной бизнес-эффективностью. Все проекты успешно прошли проверку комиссией из признанных экспертов в технологиях и бизнесе.