Искусственный интеллект поможет разобрать архив Петра I

23 сентября в МГИМО открылась международная научная конференция "Рождение империи между Востоком и Западом", посвященную 300-летию окончания Северной войны и подписанию Ништадтского мира, выдвинувшего Россию в число крупнейших мировых держав. Символическим отражением этого события стало принятие Петром I титула императора.

Петру I, а точнее его архиву было посвящено выступление исполнительного директора фонда "История Отечества" Константина Могилевского. Проект, о котором рассказал Могилевский, реализован совсем недавно и связан с петровским наследием.

Ученый напомнил, что в 1872 году к 200-летию Петра I была выдвинута идея собрать и издать его рукописное наследие. Подготовка первого тома заняла 15 лет. В 1887 году вышел первый том, получивший название "Письма и бумаги Петра Великого". Это издание было выстроено в хронологичеком порядке и продолжалось в Российской Империи, в СССР и продолжается в Российской Федерации. В 2003 году вышел 13-й том с материалами за 1713 год. В настоящее время готовится к выходу том с материалами за 1714 год. Впереди у исследователей еще 11 лет активной жизни и государственной деятельности Петра Великого.

Петр I очень внимательно относился к документированию своей деятельности. Константин Могилевский пояснил, почему так долго продолжается работа с петровским архивом: "Петр I писал много, он писал плохо, неразборчиво, используя сокращения, иностранные слова, поэтому в любое время - хоть в царской России, хоть в СССР, не более 10 специалистов во всей стране могут корректно разобрать и интерпретировать петровский почерк".

И вот недавно возникла идея помочь специалистам и ускорить работу с петровским архивом с помощью современных технологий. В проекте приняли участие ученые из Санкт-Петербургского Института истории РАН, ВШЭ. К ним под эгидой Российского исторического общества подключился СБЕР - лидер в области искусственного интеллекта. Идея состояла в том, чтобы научить компьютер распознавать почерк Петра I. Константин Могилевский обратил внимание на то, что попутно в ходе работы над проектом выяснилось, что большинство петровских бумаг пока не оцифровано. Проект дал импульс и этой работе.

Разработчики СБЕРа, работающие в области ИИ написали базовую программу. Для этого им пришлось проанализировать в специальной программе 9 тысяч строк петровских документов, распознанных ранее

.

Пример разметки текста письма Петра I - Ушакову. Фото: кадр из презентации К. Могилевского

Для усовершенствования базовой программы, разработанной в СБЕРе, был проведен Хакатон - конкурс программистов, в котором могли принять участие и другие разработчики. Перед участниками состязания стояла непростая задача. На конференции показали слайд с примерами расшифровки надстрочных знаков и примерами написания отдельных слов.

По словам Могилевского, команда - победитель этого хакатона, представила результат, который является прорывным. Точность распознавания петровских текстов составила 97,5%! - Это очень серьезный результат, который говорит о том, что мы стоим на пороге революции в анализе не только собственно петровских текстов, но и вообще средневековых текстов, средневековой скорописи, - отметил Могилевский. - Он уточнил, что, конечно, искусственный интеллект никогда не заменит человека, не заменит ученого, и вслед за распознаванием текстов предстоит большая работа по его интерпретации: что Петр имел ввиду, что он хотел сказать. Но по оценкам ученых Санкт-Петербургского Института истории, процентов на 20 время исследователей экономится.

Если дальше работа по изданию рукописного наследия Петра I пойдет такими же темпами, как она шла до сих пор, то можно рассчитывать на завершение проекта примерно через 150 лет - к 500-летию Петра Великого. Константин Могилевский выразил надежду, что Искусственный интеллект не только поможет в этой работе, но придаст импульс, привлечет внимание молодых исследователей, в том числе и студентов МГИМО, на площадке которого проводится конференция.

Конференция "Рождение империи между Востоком и Западом" посвященная 300-летию окончания Северной войны и подписанию Ништадтского мира, выдвинувшего Россию в число крупнейших мировых держав, проводится 23-24 сентября совместно с Институтом всеобщей истории РАН, Российским историческим обществом, Фондом "История Отечества" и Фондом исторической перспективы.