Сейчас над проектом работают специалисты Института русского языка им. В.В.Виноградова РАН, НИТУ «МИСиС» и Высшей школы экономики. Для начала древнеславянские церковные тексты XI–XVII веков оцифруют и переведут в машиночитаемый вид, с точностью до отдельного символа. Затем искусственный интеллект начнет изучать закономерности употребления отдельных слов, устоявшихся выражений в зависимости от места и времени написания книги.
Как пояснил «МК» эксперт НИТУ «МИСиС» Андрей Устюжанин, проект представляет интерес в первую очередь для ученых-лингвистов, которые изучают развитие славянских языков и культуры. Однако созданная искусственным интеллектом база данных может пролить свет на происхождение многих современных слов и выражений — система позволит выяснить, как веками менялся контекст употребления отдельных слов и лексических конструкций.
Эта масштабная работа в дальнейшем ускорит формирование наиболее полного словаря нашего языка. Подобно тому, как в драме Мела Гибсона «Игры разумов» персонажи создают Оксфордский словарь, Институт русского языка много лет формирует полную базу слов и возможных контекстов их употреблений, но пока работа не окончена.
— До широкого круга людей результаты могут дойти с некоторым опозданием, но в будущем на основе базы данных и искусственного интеллекта, вполне вероятно, появится приложение для обычного гаджета, которое в условиях реального времени будет переводить древнеславянские тексты, на которых проводится богослужение. Человек будет понимать, что происходит на данном этапе службы.