В НовГУ создали нейросеть для расшифровки берестяных грамот

12 октября 2025 год, 17:21 - Общество
В НовГУ создали нейросеть для расшифровки берестяных грамот
В НовГУ разработали систему искусственного интеллекта для автоматического распознавания и интерпретации текстов древнерусских грамот. Об этом рассказали на сайте Новгородского университета. Разработка вошла в число проектов-победителей грантового конкурса «Студенческий стартап» Фонда содействия инновациям. На её реализацию выделили миллион рублей. Автор разработки — магистрант Политехнического института, ассистент кафедры информационных технологий и систем Иван Филиппов. Руководитель проекта — доцент кафедры физики твёрдого тела и микроэлектроники Ирина Телина. «Задача распознавания букв достаточно тривиальна в области компьютерного зрения, однако специфика древнерусских символов вносит дополнительную сложность. Эксперты подтверждают необходимость поиска новых инструментов для работы с древнерусскими документами. Только в Великом Новгороде уже найдено более 1200 берестяных грамот, и их количество продолжает расти с каждым годом. При этом процесс их расшифровки очень трудоёмкий и требует много времени. Многие символы могут иметь разные варианты прочтений, а разнообразие устаревших букв и наличие редких диакритических знаков усложняют классификацию по стандартным моделям», — отметил Иван Филиппов. Автоматических решений для таких задач на данный момент нет. Существующие аналоги либо недостаточно точны, либо нестабильны, либо требуют больших, размеченных вручную датасетов*. Разработка Ивана Филиппова призвана стать новым быстрым инструментом для библиографов, палеографов, архивистов. Для обучения нейросети использовали датасет из пяти «эталонных» грамот, на которых буквы были размечены вручную. При отборе грамот было важно, чтобы они были целыми, крупными по объёму и содержали наибольшее разнообразие разборчиво написанных букв. Также в датасет вошли автоматические вырезки букв, сделанные детектором. Сейчас уже создано приложение, позволяющее быстро загружать фото, автоматически детектировать боксы, распознавать буквы и экспортировать результаты. Для удобства пользователя в нём используется интуитивный интерфейс Canvas позволяет быстро и наглядно загружать любые изображения грамот, использовать функции зума и панорамы для точного выбора областей, автоматически или вручную выделять рамки вокруг букв, мгновенно редактировать, перемещать, удалять и отменять действия. Все действия выполняются мышью и горячими клавишами, а готовые инструменты Python обеспечивают простоту интеграции и отзывчивость даже на больших изображениях. Система способна обучаться самостоятельно, в будущем этот процесс планируется полностью автоматизировать. Сейчас, по мере использования программы, датасет для обучения обогащается новыми качественными расшифровками. «Система показала высокую производительность: полный прогон одного изображения занимает 1-2 секунды. Также она демонстрирует надёжность и устойчивость благодаря компактной архитектуре, плавной работе пользовательского интерфейса. Точность распознавания высокая — после всех доработок и корректировок она составляет 98%. Система уже сейчас готова к интеграции в архивные и научные проекты по изучению древнерусских грамот. То, что уже сделано, позволяет раскрыть такие функции, как датирование и установка авторства грамоты. Также модель, обученная на грамотах, хорошо работает и с рукописями, что и является основной проблемой, к решению которой в итоге мы придём. Ведь у нас хранится множество рукописей, о которых, помимо самого текста, мало чего известно. В любом случае, мы открыты к взаимодействию и готовы работать со всеми, кто может быть заинтересован в реализации проекта — например, с Центром археологических исследований НовГУ», — пояснил автор проекта. О будущем берестяных грамот ранее «53 новостям» рассказал академик РАН Алексей Гиппиус. Напомним, что недавно в Великом Новгороде нашли берестяную грамоту с посланием к матери. Также Новгородский музей-заповедник представил любовные берестяные грамоты. *Датасет — это структурированный набор данных, предназначенный для хранения, обработки и анализа информации. Информация и фото: пресс-служба Новгородского университета.

Источник: 53 новости


Комментарии

Добавить комментарий

Ваше имяимя (ник) для отображения
E-mailне показывается на сайте
Комментарий
Введите код  цифры кода

Новости - Календарь
ПНВТСРЧТПТСБВС
0102030405
06070809101112
13141516171819
20212223242526
2728293031
Реклама


Новости по годам

2025

январь, февраль, март, апрель, май, июнь, июль, август, сентябрь, октябрь,

2024

январь, февраль, март, апрель, май, июнь, июль, август, сентябрь, октябрь, ноябрь, декабрь

2023

январь, февраль, март, апрель, май, июнь, июль, август, сентябрь, октябрь, ноябрь, декабрь

2022

январь, февраль, март, апрель, май, июнь, июль, август, сентябрь, октябрь, ноябрь, декабрь

2021

январь, февраль, март, апрель, май, июнь, июль, август, сентябрь, октябрь, ноябрь, декабрь

2020

январь, февраль, март, апрель, май, июнь, июль, август, сентябрь, октябрь, ноябрь, декабрь

2019

январь, февраль, март, апрель, май, июнь, июль, август, сентябрь, октябрь, ноябрь, декабрь

2018

январь, февраль, март, апрель, май, июнь, июль, август, сентябрь, октябрь, ноябрь, декабрь

2017

январь, февраль, март, апрель, май, июнь, июль, август, сентябрь, октябрь, ноябрь, декабрь

2016

январь, февраль, март, апрель, май, июнь, июль, август, сентябрь, октябрь, ноябрь, декабрь

2015

январь, февраль, март, апрель, май, июнь, июль, август, сентябрь, октябрь, ноябрь, декабрь

2014

январь, февраль, март, апрель, май, июнь, июль, август, сентябрь, октябрь, ноябрь, декабрь

2013

январь, февраль, март, апрель, май, июнь, июль, август, сентябрь, октябрь, ноябрь, декабрь

2012

январь, февраль, март, апрель, май, июнь, июль, август, сентябрь, октябрь, ноябрь, декабрь

2011

январь, февраль, март, апрель, май, июнь, июль, август, сентябрь, октябрь, ноябрь, декабрь

2010

январь, февраль, март, апрель, май, июнь, июль, август, сентябрь, октябрь, ноябрь, декабрь