Об эффективности метрических алгоритмов распознавания на базе k ближайщих соседей
Ключевые слова:
Метод Надарая– Ватсона, решающее правило, целевая функция, устойчивость признакаАннотация
Рассматривается решение задачи распознавания с двумя классами с применением метрических алгоритмов на базе k ближайших соседей. Вариантами решения предлагаются: классический алгоритм KNN на основе непараметрической оценки плотности распределения вероятностей; метод Надарая-Ватсона NW вычисления регрессионной зависимости по определяемым значениям целевого признака; вычисления оценок в локальной окрестности объектов и разбиения их значений на непересекающиеся интервалы с доминированием в них представителей одного из двух классов. Критериями оптимальности служили правило мажоритарности для KNN, точность разделение значений целевого признака на числовой оси для NW и устойчивости оценок объектов в границах интервалов. При поиске оптимальных значений k для перечисленных вариантов применялся метод скользящего контроля. Результаты полученных решений демонстрируется на выборке GERMAN из репозитория по описаниям 1000 объектов в разнотипном признаковом пространстве. Доказана эффективность выбора значений k по показателю устойчивости оценок объектов на числовой оси. Обоснование эффективности основывается на теории нечеткой логики.
Библиографические ссылки
Игнатьев Н.А., Турсунмуротов Д.Х. Цензурирование обучающих выборок с использованием регуляризации отношений связанности объектов классов // Научно технический вестник информационных технологий, механики и оптики.– 2024.– Т. 24, №2.– С. 322-329.– doi: http://dx.doi.org/10.17586/2226-1494-2024-24-2-322-329.
Kloke J., McKean J. Nonparametric Statistical Methods Using R.– CRC Press,– 2014. С. 98-106.
Liu Z. et al. KAN: Kolmogorov-Arnold Networks // arXiv.– 2024.– arxiv.org/abs/2404. 19756.
Игнатьев Н.А., Акбаров Б.Х. Оценка близости структур отношений объектов обуча ющей выборки на многообразиях наборов латентных признаков // Вестник Томского государственного университета.Управление, вычислительная техника и информатика.– 2023.– №65.– С. 69-78.– doi: http://dx.doi.org/10.17223/19988605/65/7.
Ignatyev N.A., Madrakhimov Sh.F., Saidov D.Y. Stability of Object Classes and Selection of the Latent Features // International journal of engineering technology and sciences. 2017.– doi: http://dx.doi.org/10.15282/ijets.7.2017.1.9.1071.
Саидов Д.Ю. Нелинейной отображение наборов признаков на числовую ось и дискриминантный анализ данных // Проблемы вычислительной и прикладной математики.– 2017.– №1.– С. 18-23.
Згуральская Е.Н Устойчивость разбиения данных на интервалы в задачах распознавания и поиск скрытых закономерностей // Известия Самарского центра Российской академии наук.– 2018.– №4.– С. 826-829.
Саидов Д.Ю., Игнатьев Н.А. Вычисление сложности эффективных алгоритмов выбо ра оптимальных границ интервалов Проблемы информатики и энергетики.– 2014. №6.– С. 35-40.
Рахимова М.А., Игнатьев Н.А. Формирование и анализ наборов информативных при знаков объектов по парам классов Искусственный интеллект и принятие .– 2021.– №4.– С. 18-26.– doi: http://dx.doi.org/10.14357/20718594210402.
Саидов Д.Ю. Информационные модели на основе нелинейных преобразований призна кового пространства в задачах распознавания : дисс.... доктора философии по физ. мат. наук.– Ташкент, 2017.– 93 с.– doi: http://dx.doi.org/10.14357/20718594210402.
URL: https://archive.ics.uci.edu/dataset/144/statlog+german+credit+data
Загрузки
Опубликован
Выпуск
Раздел
Лицензия

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.