Об эффективности метрических алгоритмов распознавания на базе k ближайщих соседей

Авторы

  • Н.А. Игнатьев Национальный университет Узбекистана имени Мирзо Улугбека Автор
  • Д.Х. Турсунмуротов Национальный университет Узбекистана имени Мирзо Улугбека Автор

Ключевые слова:

Метод Надарая– Ватсона, решающее правило, целевая функция, устойчивость признака

Аннотация

Рассматривается решение задачи распознавания с двумя классами с применением метрических алгоритмов на базе k ближайших соседей. Вариантами решения предлагаются: классический алгоритм KNN на основе непараметрической оценки плотности распределения вероятностей; метод Надарая-Ватсона NW вычисления регрессионной зависимости по определяемым значениям целевого признака; вычисления оценок в локальной окрестности объектов и разбиения их значений на непересекающиеся интервалы с доминированием в них представителей одного из двух классов. Критериями оптимальности служили правило мажоритарности для KNN, точность разделение значений целевого признака на числовой оси для NW и устойчивости оценок объектов в границах интервалов. При поиске оптимальных значений k для перечисленных вариантов применялся метод скользящего контроля. Результаты полученных решений демонстрируется на выборке GERMAN из репозитория по описаниям 1000 объектов в разнотипном признаковом пространстве. Доказана эффективность выбора значений k по показателю устойчивости оценок объектов на числовой оси. Обоснование эффективности основывается на теории нечеткой логики.

Библиографические ссылки

Игнатьев Н.А., Турсунмуротов Д.Х. Цензурирование обучающих выборок с использованием регуляризации отношений связанности объектов классов // Научно технический вестник информационных технологий, механики и оптики.– 2024.– Т. 24, №2.– С. 322-329.– doi: http://dx.doi.org/10.17586/2226-1494-2024-24-2-322-329.

Kloke J., McKean J. Nonparametric Statistical Methods Using R.– CRC Press,– 2014. С. 98-106.

Liu Z. et al. KAN: Kolmogorov-Arnold Networks // arXiv.– 2024.– arxiv.org/abs/2404. 19756.

Игнатьев Н.А., Акбаров Б.Х. Оценка близости структур отношений объектов обуча ющей выборки на многообразиях наборов латентных признаков // Вестник Томского государственного университета.Управление, вычислительная техника и информатика.– 2023.– №65.– С. 69-78.– doi: http://dx.doi.org/10.17223/19988605/65/7.

Ignatyev N.A., Madrakhimov Sh.F., Saidov D.Y. Stability of Object Classes and Selection of the Latent Features // International journal of engineering technology and sciences. 2017.– doi: http://dx.doi.org/10.15282/ijets.7.2017.1.9.1071.

Саидов Д.Ю. Нелинейной отображение наборов признаков на числовую ось и дискриминантный анализ данных // Проблемы вычислительной и прикладной математики.– 2017.– №1.– С. 18-23.

Згуральская Е.Н Устойчивость разбиения данных на интервалы в задачах распознавания и поиск скрытых закономерностей // Известия Самарского центра Российской академии наук.– 2018.– №4.– С. 826-829.

Саидов Д.Ю., Игнатьев Н.А. Вычисление сложности эффективных алгоритмов выбо ра оптимальных границ интервалов Проблемы информатики и энергетики.– 2014. №6.– С. 35-40.

Рахимова М.А., Игнатьев Н.А. Формирование и анализ наборов информативных при знаков объектов по парам классов Искусственный интеллект и принятие .– 2021.– №4.– С. 18-26.– doi: http://dx.doi.org/10.14357/20718594210402.

Саидов Д.Ю. Информационные модели на основе нелинейных преобразований призна кового пространства в задачах распознавания : дисс.... доктора философии по физ. мат. наук.– Ташкент, 2017.– 93 с.– doi: http://dx.doi.org/10.14357/20718594210402.

URL: https://archive.ics.uci.edu/dataset/144/statlog+german+credit+data

Загрузки

Опубликован

2024-10-11

Выпуск

Раздел

Статьи