Корпусно-ориентированная модель среднетюркского языка на основе взвешенного усреднения
DOI:
https://doi.org/10.71310/pcam.5_69.2025.10Ключевые слова:
среднетюркский язык, модель усреднения, корпусная лингвистика, искусственный язык, математическая лингвистика, тюркские языкиАннотация
В работе формализуется и расширяется классическая концепция .среднетюркского. языка (Каримов–Муталов, 1992) средствами корпусной и вычислительной лингвистики. Предложенная модель рассматривает выбор .оптимальной. формы языковой единицы как решение задачи многокритериальной оптимизации над на- бором факторов: частотность, распространённость, простота, культурная совместимость, а также матрица межъязыковой взаимопонимаемости. Для устойчивости и интерпретируемости вводятся мягкие (softmax) и .насыщающиеся. веса, доменные и диахронические модификаторы, ограничения .справедливости. между языками. Модель демонстрирует точность выбора языковых форм до 89%, уровень понятности – 78%, высокую грамматическую согласованность (0,92) и скорость усвоения (0,85). Обсуждаются возможность применения модели в машинном переводе, а также ограничения и направления дальнейшей валидации.
Библиографические ссылки
Karimov B.R., Mutalov Sh.Sh. O’rtaturk tili (“ORTATURK” – the averaged Turkic language). – Toshkent: Mehnat, 1992.
Johanson L., Csatу Y.B. The Turkic Languages. – 5th ed. – London: Routledge, 1998.
Languages Special Issue: Theoretical Studies on Turkic Languages // Languages journal. – 2023.
Kornfilt J. Turkish. – London: Routledge, 1997. – 575 p.
Yace C.B. The Case of the Turkish Language Reform // Omnes Journal of Multicultural Society. – 2016. – .6(2). – P. 1-20.
Bazarbayeva Z.M. Syllable Theory and Diachronic Phonology of Turkic Languages // Journal of Language and Linguistic Studies. – 2017. – .13(2). – P. 100-115.
Guksel A., Kerslake C. Turkish: A Comprehensive Grammar. – 5th ed. – London: Routledge, 2005.
Uzsoy A.S., Guksel A. Focus in Turkish // Lingua. – 2003. – .113(11). – P. 1023-1052.
Johansson L. Contact-induced change in Turkic languages // In Language Change: Contributions to the Study of Its Causes. – Berlin: Mouton de Gruyter, 2002. – P. 133-156.
Stachowski M. Dolgan and Yakut: Historical phonological perspectives. – Krakуw: Jagiellonian University Press, 2013.
Starostin S., Dybo A., Mudrak O. Etymological Dictionary of the Altaic Languages. – Leiden: Brill, 2003.
Isbarov K., et al. TUMLU: A Unified and Native Language Understanding Benchmark for Turkic Languages. – 2025. – https://arxiv.org/abs/2502.11020.
Yeshpanov R., et al. Multilingual Text-to-Speech Synthesis for Turkic Languages Using Transliteration. – 2023. – https://arxiv.org/abs/2305.15749.
Johansson L., Csatу Y.A. The Turkic Languages and Peoples: An Introduction to Turkic Studies. – Wiesbaden: Harrassowitz, 2006.
Aydemir Y. Language Policy and Planning in Modern Turkey // Journal of Sociolinguistics. – 2010. – .14(2). – P. 214-235.
Johansson L. The History of Turkic // The Oxford Handbook of Iranian Languages (Ed. S. Windfuhr). – Oxford: Oxford University Press, 2013. – P. 55-78.
Загрузки
Опубликован
Выпуск
Раздел
Лицензия
Copyright (c) 2025 Б.И. Боборахимов

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.