Новости

Вице-мэр Ракова: Более 20 млн раз пользователи обратились к порталу по генеалогии «Поиск по архивам» за год

mos.ru
Вице-мэр Ракова: Более 20 млн раз пользователи обратились к порталу по генеалогии «Поиск по архивам» за год

Свыше 20 млн раз воспользовались москвичи порталом «Поиск по архивам», сообщила заммэра по вопросам социального развития Анастасия Ракова.
Она напомнила, что в запущенный год назад портал загрузили более 5,4 млн страниц исторических материалов из Главархива Москвы и другие материалы.

Сервис упрощает пользователям процесс поиска историй своих семей, помогает ученым и журналистам, а на страницах, содержащих устаревшие символы и рукописи, тренируется искусственный интеллект.

Поиск по архивам — запущенный в начале 2023 года сервис Яндекса, который помогает быстро находить упоминания людей, населенных пунктов и событий в расшифрованных нейросетью рукописных документах XVIII-XX веков.

«На протяжении нескольких последних лет запросы, связанные с поиском предков и исследованием прошлого семьи, оказываются одними из самых популярных в Главархиве Москвы», – отметила Ракова.

Несколько лет назад появился онлайн-сервис «Моя семья», на котором разместили оцифрованные метрические книги. На основе ресурса «Моя семья» нейросеть «Поиска по архивам» училась читать рукописные тексты.

За год к сервису обратились более 20 млн раз, а нейросеть проанализировала свыше 10 млн страниц исторических документов.

Сервис «Поиск по архивам» помогает историкам, социологам, демографам, журналистам и простым москвичам находить информацию об исторических событиях и личностях. Как отметили в Соцкомплексе столицы, работать с архивными документами теперь так же легко, как с привычным поиском Яндекса.

Сейчас в «Поиске по архивам» доступны документы из архивов 11 регионов, в том числе Москвы, Московской, Оренбургской, Новгородской, Иркутской, Астраханской и других областей. Всего нейросеть Яндекса распознала более 60 тысяч рукописных и печатных текстов середины XVIII — начала XX веков: в сумме это более 10 миллионов страниц, или 492 миллионов строк. В «Поиске по архивам» хранятся расшифрованные архивные дела, в которых содержится информация о людях, родившихся в России до 1917 года. Сервис собрал 3,6 млн оцифрованных страниц периодических изданий.

Технология расшифровки в «Поиске по архивам» основана на оптическом распознавании символов. Нейросеть узнает утратившие актуальность знаки, учитывает особенности почерка и за несколько секунд преобразует трудночитаемые записи в печатный текст. Для работы с версткой газетных страниц нейросеть научили распознавать текст на огромных полосах, набранный мелким шрифтом на низкоплотной бумаге.

Последние новости