Корпусно-ориентированная модель среднетюркского языка на основе взвешенного усреднения

Авторы

  • Б.И. Боборахимов Научно-исследовательский институт развития цифровых технологий и искусственного интеллекта Автор
  • Д.А. Ахмеджанова Узбекский государственный университет мировых языков Автор
  • Х.Д. Шарипов Научно-исследовательский институт развития цифровых технологий и искусственного интеллекта Автор

DOI:

https://doi.org/10.71310/pcam.5_69.2025.10

Ключевые слова:

среднетюркский язык, модель усреднения, корпусная лингвистика, искусственный язык, математическая лингвистика, тюркские языки

Аннотация

В работе формализуется и расширяется классическая концепция .среднетюркского. языка (Каримов–Муталов, 1992) средствами корпусной и вычислительной лингвистики. Предложенная модель рассматривает выбор .оптимальной. формы языковой единицы как решение задачи многокритериальной оптимизации над на- бором факторов: частотность, распространённость, простота, культурная совместимость, а также матрица межъязыковой взаимопонимаемости. Для устойчивости и интерпретируемости вводятся мягкие (softmax) и .насыщающиеся. веса, доменные и диахронические модификаторы, ограничения .справедливости. между языками. Модель демонстрирует точность выбора языковых форм до 89%, уровень понятности – 78%, высокую грамматическую согласованность (0,92) и скорость усвоения (0,85). Обсуждаются возможность применения модели в машинном переводе, а также ограничения и направления дальнейшей валидации.

Библиографические ссылки

Karimov B.R., Mutalov Sh.Sh. O’rtaturk tili (“ORTATURK” – the averaged Turkic language). – Toshkent: Mehnat, 1992.

Johanson L., Csatу Y.B. The Turkic Languages. – 5th ed. – London: Routledge, 1998.

Languages Special Issue: Theoretical Studies on Turkic Languages // Languages journal. – 2023.

Kornfilt J. Turkish. – London: Routledge, 1997. – 575 p.

Yace C.B. The Case of the Turkish Language Reform // Omnes Journal of Multicultural Society. – 2016. – .6(2). – P. 1-20.

Bazarbayeva Z.M. Syllable Theory and Diachronic Phonology of Turkic Languages // Journal of Language and Linguistic Studies. – 2017. – .13(2). – P. 100-115.

Guksel A., Kerslake C. Turkish: A Comprehensive Grammar. – 5th ed. – London: Routledge, 2005.

Uzsoy A.S., Guksel A. Focus in Turkish // Lingua. – 2003. – .113(11). – P. 1023-1052.

Johansson L. Contact-induced change in Turkic languages // In Language Change: Contributions to the Study of Its Causes. – Berlin: Mouton de Gruyter, 2002. – P. 133-156.

Stachowski M. Dolgan and Yakut: Historical phonological perspectives. – Krakуw: Jagiellonian University Press, 2013.

Starostin S., Dybo A., Mudrak O. Etymological Dictionary of the Altaic Languages. – Leiden: Brill, 2003.

Isbarov K., et al. TUMLU: A Unified and Native Language Understanding Benchmark for Turkic Languages. – 2025. – https://arxiv.org/abs/2502.11020.

Yeshpanov R., et al. Multilingual Text-to-Speech Synthesis for Turkic Languages Using Transliteration. – 2023. – https://arxiv.org/abs/2305.15749.

Johansson L., Csatу Y.A. The Turkic Languages and Peoples: An Introduction to Turkic Studies. – Wiesbaden: Harrassowitz, 2006.

Aydemir Y. Language Policy and Planning in Modern Turkey // Journal of Sociolinguistics. – 2010. – .14(2). – P. 214-235.

Johansson L. The History of Turkic // The Oxford Handbook of Iranian Languages (Ed. S. Windfuhr). – Oxford: Oxford University Press, 2013. – P. 55-78.

Опубликован

2025-11-16

Выпуск

Раздел

Статьи