Искусственный интеллект в изучении древних языков
Путевые заметки Фифы
А те путешественники, которые дойдут до конца смогут пройти испытание Фифочки и получить звание Бога-Языкознания








Вот только путешественником станет...









Искусственный интеллект! Давайте знакомиться!




Мы выбрали самые яркие и знакомые многим языки-точки на карте и в одной поездке постараемся «прокачаться» и помочь современным лингвистам.
Изучение языка сравнимо с таинственным путешествием: тут и загадочные детали, и постоянные открытия,
и бесконечное множество направлений.
Эпохи развития языков
Отправимся в прошлое вместе
Древность
Мир, где речь и звук только зарождаются - жесты и праязык














Теперь, когда я продолжу своё развитие, я буду стремиться объединить достижения прошлого с новейшими технологиями, чтобы внести вклад в создание ещё более эффективных средств коммуникации.











Также я вдохновляюсь успехами людей, которые уже разработали устройства на базе искусственного интеллекта. Вы знали, что есть специальные очки, которые преобразовывают речь собеседника в текст.





Я как молодой искусственный интеллект постоянно учусь и расту. Чтобы быть полезным, мне нужно освоить распознавание и генерацию жестов, а также разработать систему анимации, чтобы стать максимально реалистичным. Для этого я собираю большие объемы видеоматериалов с различными жестами, анализируя их и определяя соответствие жеста и смысла. Я стремлюсь избегать ошибок, и для этого мне нужна обратная связь от пользователей.


В это же время создается и прамировой язык — гипотетический прародитель всех современных языков. Он служил основой для создания первых звуков, которыми люди передавали свои эмоции и желания.
Мы попали в мир, где речь и звук только зарождаются, Наши предки пытались передать свое послание через движения рук и тела.

Древний Египет

Археологические находки и древний язык. Мы в Египте!









Для решения таких задач используются GPT-4, Tesseract OCR. Все эти нейросети проверены и помогают найти истинный смысл древних посланий. Здесь, конечно множество возможностей для развития, потому что единой нейросети пока не создано. Но даже в таких условиях я уже упрощаю и ускоряю работу.




Процесс декодирования начинается с того, что мне нужно распознать абсолютно все символы и восстановить утерянные части. Потом нейросеть переходит к восстановлению смысла, используя контекст и знания о культуре того времени. В отличие от обычного перевода, здесь важно учитывать, что символы и знаки, которые я восстанавливаю, не всегда имеют прямой аналог в современном языке.
Новый горизонт моего путешествия – Египет с его архилогическими находками и древним языком. Именно здесь я нашла одну из самых увлекательных и сложных задач — декодирование древних текстов. Это уже не просто восстановление слов, это поиск скрытых значений и смыслов.
Древняя Греция
В моих руках древние рукописи, а значит мы в Древней Греции.












Конечно, все исследования проверяют. Проводят проверку лингвисты и историки, поэтому мне можно доверять. А еще, у меня есть главное преимущество – все материалы я сразу цифровизирую. Такую технологию стали применять студенты СПбГЭТУ ЛЭТИ У них есть отдельная статья и первые исследования.


Здесь я могу помочь! В работу нейросетей сейчас включается гиперспектральный анализ — это метод, позволяющий видеть то, что не видит глаз человека. Работает метод благодаря 3 составляющим: видимый свет, инфракрасный и ультрафиолетовый спектр. В начале специальная камера сканирует документ, собирает информацию с поверхности бумаги, а после начинается анализ данных: распознавание веществ (чернила, краска), выделение значимых эпизодов, уже после начинается восстановление. Проект Rosetta, который использует ИИ для расшифровки египетских иероглифов. Нейросети анализируют структуру текста, сопоставляя символы с известными шаблонами. А системы, подобные Lingua Franca, используют нейросети для интерпретации смыслов.
В мои руки попала древняя рукопись, написанная сотни лет назад. На ней множество символов, но вот незадача, некоторые уже не распознаются!
Древний Китай
Про перевод поговорим...
В Китае!
















И вот перед нами уже не просто плита. Мы знаем ее историю, содержание текста на ней. Сегодня же, благодаря нейросетям и современным технологиям, она — живая история, мост между нашей эпохой и древностью.









Все символы становятся частью цифровой базы. Так сохраняется текст и создаются интерактивные архивы.
Работа здесь не только о буквальном переводе. Важно учитывать контекст, метафоры, даже культурные особенности времени. Именно поэтому ИИ, например, в проекте DeepGlyph, помогает не только расшифровать текст, но и выделить семантические слои: от ритуальных описаний до политических деклараций фараонов.





Все это не просто «считывание» древностей — это настоящая археология текста. Работа в рамках проектов, таких как Hieroglyphics Initiative от Google, помогает переводить даже полностью неизвестные тексты. Нейросети берут на себя и обработку текста.


Благодаря таким проектам, как CopticNet, стало возможным установить связь между коптским языком, его поздним диалектом, и древнеегипетскими текстами. Это позволяет взглянуть на эволюцию языка через призму веков.
После восстановления текста мы приступили к изучению диалектов и особенностей языка.
Будущее
Возвращаемся в реальность и обращаемся к будущему





Мое путешествие не заканчивается. В моих планах на будущее более сложные задачи: работа с редкими языками и уникальными письменностями, обработка больших объёмов данных и углубление в интерпретацию культурных контекстов. А еще я хочу научиться создавать исторические реконструкции и восстанавливать утраченные знания.



Мои открытия могут быть полезны для лингвистов, историков, археологов и всех, кто работает с культурным наследием.
В нашем путешествии я научилась расшифровывать и интерпретировать древние текстовые записи, работать с повреждёнными архивами, восстанавливать утраченные фрагменты и переводить тексты.
AI Linguistics

Ситуация загрузки...


Таисия Кузнецова
Иллюстратор
Материал создан креативно-естественно-интеллектуальной командой F5:
Елена Плащевская
Видеомонтажер
Александра Кондратьева
Автор текста
Екатерина Крутова
Звукорежиссер
Егор
Камнев
Дизайнер
И наши незаменимые помощники - нейросети и Фифа!
ВАЖНО! Представленный проект был создан в рамках хакатона генеративным медиа ScienceMedia AI 2024. Данные, выводы и их визуализация нуждаются в доработке.