Анастасия Ракова рассказала об использовании нейросетей для распознавания архивных документов

Жители Москвы более 20 млн раз обратились к порталу «Поиск по архивам», он существует с 2023 года. В нем можно найти свыше 5,4 млн страниц исторических материалов из Главархива Москвы и др. По словам заместителя градоначальника по вопросам социального развития Анастасии Раковой, упрощен поиск истории семьи и работа ученых и журналистов.

Портал является сервисом Яндекса. С его помощью можно находить упоминания людей, населенных пунктов и событий в расшифрованных нейросетью рукописных документах XVIII-XX веков.

«На протяжении нескольких последних лет запросы, связанные с поиском предков и исследованием прошлого семьи, оказываются одними из самых популярных в Главархиве Москвы. Это особенно заметно в Год семьи. Мы стремимся помочь жителям в столь важном деле и ищем способы сделать доступ к документам проще. Так, несколько лет назад мы открыли онлайн-сервис "Моя семья" и разместили в нем оцифрованные метрические книги — документы, содержащие сведения о рождении, браке и смерти москвичей и жителей Московской губернии разных вероисповеданий. На основе ресурса "Моя семья" нейросеть "Поиска по архивам" училась читать рукописные тексты. За год работы сервиса к порталу обратились более 20 миллионов раз, что говорит о его популярности и необходимости. Сама же нейросеть проанализировала свыше 10 миллионов страниц исторических документов», - пояснила заммэра.

В московском Соцкомплексе уточнили, что работать с документами можно так же, как с обычным поиском Яндекса.

Представлены сведения из архивов 11 регионов, например, Москвы, Московской, Оренбургской, Новгородской, Иркутской, Астраханской областей и др. За все время нейросеть узнала свыше 60 тысяч рукописных и печатных текстов середины XVIII — начала XX веков.

Представлено 3,6 млн оцифрованных страниц периодических изданий, например, из таких, как «Советский спорт» и «Вечерняя Москва».

Технология построена на оптическом распознавании символов. Нейросеть распознает устаревшие знаки, обрабатывает особенности почерка и быстро преобразует такие записи в печатный текст.

-- Фото: mos.ru


← Экстренная ситуация? Набираем номер 112

→ Воспитанники центра для детей-сирот из Тропарево-Никулино испекли хлеб вместе с технологами известной сети супермаркетов