В римском мире письменность была повсюду: от императорских памятников до предметов повседневного обихода. Политические граффити, любовные стихи, эпитафии, торговые соглашения, приглашения на дни рождения и даже магические заклинания гравировались на камне, металле и керамике. Эти тексты предоставляют современным историкам уникальную возможность заглянуть в повседневную жизнь Древнего Рима, но многие из них фрагментированы, размыты или намеренно повреждены, что затрудняет их реставрацию, датировку и локализацию без контекстной информации.
Группа исследователей представила в журнале Nature новаторское достижение: Aeneas – первая модель искусственного интеллекта, предназначенная для контекстуализации древних надписей. Эта система, разработанная совместно с Ноттингемским университетом и в партнёрстве с учёными из Уорикского университета, Оксфордского университета и Афинского университета экономики и бизнеса (AUEB), обещает произвести революцию в изучении латинской эпиграфики.
Традиционно историки полагались на свой опыт и специализированные ресурсы для выявления «текстовых параллелей», то есть надписей, имеющих сходство в фразировке, синтаксисе, стандартизированных формулах или происхождении. Этот ручной и трудоемкий процесс может занимать недели или месяцы. Aeneas значительно ускоряет его, анализируя тысячи надписей за считанные секунды и выявляя связи, позволяющие экспертам интерпретировать фрагменты с большей точностью.
Модель, названная в честь мифологического героя Энея, представляет собой развитие системы Ithaca , более ранней системы, созданной для восстановления, датирования и определения местоположения греческих надписей. Но Aeneas идёт дальше: она не только реконструирует повреждённые тексты, но и даёт им контекстуальное представление, помогая исследователям осмысливать отдельные фрагменты и делать более глубокие выводы о прошлом.
Среди наиболее примечательных особенностей Энея:
Aeneas — это мультимодальная генеративная нейронная сеть, принимающая на вход как текст надписи, так и изображение объекта, на котором она выгравирована. Для её обучения исследователи собрали и гармонизировали эпиграфические базы данных, такие как Epigraphic Database Roma (EDR), Epigraphic Database Heidelberg (EDH) и Epigraphic Database Clauss Slaby (EDCS-ELT), создав единый набор данных под названием Latin Epigraphic Dataset (LED), содержащий более 176 000 латинских надписей.
Модель использует декодер на основе трансформатора для обработки текста, в то время как специализированные сети отвечают за восстановление символов, датировку и географическую атрибуцию. Также применяется метод, называемый «внедрением», который кодирует текстовую и контекстную информацию каждой надписи в математическое представление, отражающее такие детали, как язык, эпоха, местоположение и связь с другими текстами.
В ходе тестирования Aeneas продемонстрировал 73%-ную точность восстановления пропусков длиной до десяти символов и 58%-ную точность даже при неизвестной длине пропущенного текста. В плане географической локализации модель смогла сопоставить надпись с одной из 62 римских провинций с точностью 72%. Погрешность датировки составила всего 13 лет по сравнению с оценками историков.
Одним из наиболее ярких примеров стал анализ «Res Gestae Divi Augusti» – автобиографии императора Августа, датировка которой вызывает споры уже несколько десятилетий. Эней не только выделил два хронологических пика (один – около 10–1 гг. до н. э., а другой – между 10–20 гг. н. э.), но и обнаружил имперские юридические тексты, связанные с наследием Августа, показав, как идеология империи воспроизводилась в различных медиа и регионах.
Чтобы оценить влияние Aeneas на реальный мир, было проведено исследование, в котором приняли участие 23 историка. Результаты показали, что исследователи добились лучших результатов, объединив свои экспертные знания с рекомендациями модели. По словам одного из участников:
Параллели, выявленные Aeneas, полностью изменили моё восприятие надписи. Они выявили детали, которые сыграли решающую роль в её реставрации и датировке.
Чтобы сделать использование модели более доступным, создатели Aeneas запустили бесплатную интерактивную версию, доступную исследователям, студентам и музейным работникам. Кроме того, код и данные модели опубликованы в открытом доступе, что облегчает её адаптацию к другим древним языкам, письменностям и носителям информации, таким как папирусы или монеты.
«Саммит Китай-ЕС не решил ни одного проблемного вопроса», – констатирует европейская пресса – но на ...
В ходе продолжающихся археологических раскопок на ферме Скейлл на острове Раузи, Оркнейские острова,...
Если тебе когда-нибудь придет в голову мысль, что в твоем возрасте не подобает чего-либо делать, просто напомни себе, что ты никогда уже не будешь таким молодым, как сегодня.
Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.
Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций
(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном
цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с
точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии
предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей
сети "Интернет", находящихся на территории Российской Федерации)".