На перекрёстке прошлого с будущим. В Главархиве рассказали, как нейросеть распознаёт записи
Главархив Москвы совместно с Яндексом запустили сервис поиска по историческим документам. Теперь искусственный интеллект (ИИ) помогает прочесть неразборчивый почерк и найти всю необходимую информацию. О том, как это работает, нам рассказала главный хранитель фондов Главархива Москвы Марьям Кустова.
«ЯТЬ» И «ФИТА»
Новая платформа называется «Поиск по архивам». Она облегчает труд москвичей, занимающихся историей своей семьи или научными исследованиями.
«Сейчас в системе уже размещено 2,5 млн страниц, и коллеги из Яндекса обещают постоянно пополнять её новыми документами. В базе достаточно ввести фамилию или место крещения человека, чтобы нейросеть выдала все подходящие варианты рукописных текстов, – говорит Марьям Кустова. – Это очень прогрессивная система поиска, которая сама может обучаться и совершенствоваться».
Документы, с которыми работает ИИ, можно разделить на три типа. Это метрические книги (записи о рождении, браке и смерти), исповедные ведомости (посемейные списки прихожан церквей) и ревизские сказки (прообразы переписей населения).
«Пока сервис работает только с документами православной церкви, но со временем появятся и другие, – уточнила Кустова. – Среди них могут быть записи московской синагоги, мечетей, католических и лютеранских церквей. Почти все они уже отсканированы и доступны для онлайн-просмотра через ресурс Главархива «Моя семья».
Основой нейросети является технология оптического распознавания текста. ИИ узнаёт вышедшие из употребления буквы, учитывает особенности почерка и за несколько секунд превращает рукописные записи в печатный текст.
«В 1918 году в результате реформы русского языка были ликвидированы некоторые буквы, например, «ять» и «фита», – объясняет специалист. – Неподготовленному человеку сложно прочесть оригинал дореволюционного текста, а нейросеть с этим справляется».
ГДЕ ОТПЕВАЛИ ГОГОЛЯ?
Среди метрических книг Главархива есть уникальные документы. Например, записи о рождении и бракосочетании Александра Пушкина. Марьям Кустова показывает нам метрическую ведомость с выцветшими страницами.
«Посмотрите, здесь запись о рождении Александра Сергеевича, – говорит она. – На самом деле споры о месте, где родился поэт, начались уже в XIX веке. Одно время считалось, что это Санкт-Петербург, однако документы свидетельствуют о московском происхождении поэта».
Ещё одна метрическая книга содержит информацию о смерти Николая Гоголя. До 1990-х годов исследователи полагали, что писателя отпевали в церкви мученицы Татьяны при МГУ.
«Когда подняли документы, оказалось, что в этом храме прошло торжественное прощание с Николаем Гоголем, а чин отпевания был совершён в Борисоглебской церкви на Поварской улице, – рассказывает Марьям Кустова. – Как видите, архивные документы хранят в себе массу любопытного. Например, именно из метрической книги мы узнали, что крёстной матерью Михаила Лермонтова была его бабушка, которая сыграла большую роль в жизни поэта».
Специалист Главархива достаёт ещё два документа – записи о рождении Марины Цветаевой и Фёдора Достоевского. Последняя сделана в церкви при Мариинской больнице для бедных, где отец Фёдора Михайловича служил врачом.
«Здесь написано, что крёстной матерью писателя была его тётя. Именно она взяла опекунство над детьми Достоевских, когда их родители умерли, и оплачивала обучение Фёдора Михайловича», – объясняет Марьям Кустова.
МОЯ ИСТОРИЯ
Копаться в архивах интересно не только историкам, но и обычным людям, решившим восстановить историю своей семьи.
«Перед тем как обратиться к архивам, изучите все документы, которые есть у вас дома, – советует Марьям Кустова. – У большинства населения Российской империи до 1917 года не было фамилий, это затрудняет поиск. Однако постарайтесь обратить внимание на год и место рождения, а также название церкви, где крестили человека. Такие данные сильно помогут при работе с архивами. Также можно поискать необходимые документы на сервисе «Моя семья». Здесь размещено более 9 млн страниц».
КСТАТИ
В конце января клубу мемуаристики «Линия жизни», который был создан Главархивом и центрами московского долголетия, исполнилось два года. Участников онлайн-занятий обучают, как работать с архивами, писать мемуары и воссоздавать историю своей семьи. На сегодняшний день клуб насчитывает более 500 человек. Многие из них уже отдали свои произведения на вечное хранение в Главархив. Благодаря этим мемуарам можно узнать не только частные истории людей, но и погрузиться в быт москвичей разных эпох. Например, старожилы рассказывают о том, как назначали встречи, когда не было телефонов, или вспоминают об отсутствии дверей в городских трамваях. Участником клуба мемуаристики может стать любой желающий старше 55 лет. Для этого нужно позвонить по телефону единой справочной службы: +7 (495) 870-44-44.
АЛЕКСАНДР АНДРУЩЕНКО