
Жители Москвы более 20 млн раз обратились к порталу «Поиск по архивам», он существует с 2023 года. В нем можно найти свыше 5,4 млн страниц исторических материалов из Главархива Москвы и др. По словам заместителя градоначальника по вопросам социального развития Анастасии Раковой, упрощен поиск истории семьи и работа ученых и журналистов.
Портал является сервисом Яндекса. С его помощью можно находить упоминания людей, населенных пунктов и событий в расшифрованных нейросетью рукописных документах XVIII-XX веков.
«На протяжении нескольких последних лет запросы, связанные с поиском предков и исследованием прошлого семьи, оказываются одними из самых популярных в Главархиве Москвы. Это особенно заметно в Год семьи. Мы стремимся помочь жителям в столь важном деле и ищем способы сделать доступ к документам проще. Так, несколько лет назад мы открыли онлайн-сервис "Моя семья" и разместили в нем оцифрованные метрические книги — документы, содержащие сведения о рождении, браке и смерти москвичей и жителей Московской губернии разных вероисповеданий. На основе ресурса "Моя семья" нейросеть "Поиска по архивам" училась читать рукописные тексты. За год работы сервиса к порталу обратились более 20 миллионов раз, что говорит о его популярности и необходимости. Сама же нейросеть проанализировала свыше 10 миллионов страниц исторических документов», - пояснила заммэра.
В московском Соцкомплексе уточнили, что работать с документами можно так же, как с обычным поиском Яндекса.
Представлены сведения из архивов 11 регионов, например, Москвы, Московской, Оренбургской, Новгородской, Иркутской, Астраханской областей и др. За все время нейросеть узнала свыше 60 тысяч рукописных и печатных текстов середины XVIII — начала XX веков.
Представлено 3,6 млн оцифрованных страниц периодических изданий, например, из таких, как «Советский спорт» и «Вечерняя Москва».
Технология построена на оптическом распознавании символов. Нейросеть распознает устаревшие знаки, обрабатывает особенности почерка и быстро преобразует такие записи в печатный текст.