О проблемах поиска выбросов в задаче с одним классом

Авторы

  • Н.А. Игнатьев Национальный университет Узбекистана имени Мирзо Улугбека Автор
  • А.О. Тошпулатов Национальный университет Узбекистана имени Мирзо Улугбека Автор

DOI:

https://doi.org/10.71310/pcam.3_67.2025.11

Ключевые слова:

функции потерь, обучение без учителя, разнотипные данные

Аннотация

Рассматривается поиск выбросов в задаче распознавания с одним классом. Проблемы поиска связаны с выбором функций потерь, критериев оптимизации, преобразованиями разнотипных признаков. Приведены примеры из предметных областей, в которых существуют такие проблемы. Обоснованно отсутствие методов кластерного анализа для определения выбросов и возможности их однозначной интерпретации. Многообразие вариантов анализа связано с наличием неопределённостей при подборе параметров кластеризации. В качестве дополнительных знаний о предметной области даётся анализ природы среды для объектов-выбросов. С этой целью вычисляются значения ядерной плотности распределения выбросов по локальным областям фиксированного размера. Приводится способ определения локации объектов, ближайших к центру класса. Решена задача анализа метеоданных по городу Ташкенту. Для оперативного реагирования на нарушения экологии предложен переход к решению задачи классификации с двумя классами. Считается, что один класс описывает приемлимое состояние, другой отклонение от экологических норм.

Библиографические ссылки

Борисова И.А., Кутненко О.А. Очистка данных от диагностических ошибок в признаковых пространствах большой размерности Mathematical Biology and Bioinformatics, – 2019. Т. 14. – №2. – С. 464–476. doi: http://dx.doi.org/10.17537/2019.14.464.

Игнатьев Н.А., Турсунмуротов Д.Х. Цензурирование обучающих выборок с использованием регуляризации отношений связанности объектов классов Научно-технический вестник информационных технологий, механики и оптики, – 2024. – Т. 24. – №2. – С. 322–329. doi: http://dx.doi.org/10.17586/2226-1494-2024-24-2-322-329.

Ahmed Fahim An extended DBSCAN clustering algorithm International Journal of Advanced Computer Science and Applications, – 2022. Vol. 13. – №3. – С. 245–258. doi: http://dx.doi.org/10.14569/IJACSA.2022.0130331.

Вапник В.Н. Природа статистической теории обучения / Пер. с англ. — The nature of statistical learning theory — 2nd ed. – 2000. – 324 с.

Vinod Kumar Chauhan, Kalpana Dahiya, Anuj Sharma Problem formulations and solvers in linear SVM:a review Artif Intell Rev, – 2019. – Vol. 52. – C. 803–855. doi: http://dx.doi.org/10.1007/s10462-018-9614-6.

Наврузов Э.Р. О формировании баз прецедентов для решения задач информационной безопасности Информатика. Информационная безопасность. Математика. Научный журнал. ВЕСТНИК РГГУ, – 2022. – №3. – С. 66–84. doi: http://dx.doi.org/10.28995/2686-679X-2022-3-66-84.

Игнатьев Н.А., Згуральская Е.Н. Кластерный анализ с применением обучения на основе отношений связанности и плотности распределения Вестник Томского государственного университета. Управление, вычислительная техника и информатика, – 2024. – №68. – С. 66–74. doi: http://dx.doi.org/10.17223/19988605/68/7.

Беккер Ж., Дэвис Ж. Обучение на основе положительных и необозначенных данных: Опрос. 2020 / Пер. с англ. Learning from positive and unlabeled data: A survey. – 2020. –№109. – С. 719–760.

Загрузки

Опубликован

2025-07-27

Выпуск

Раздел

Статьи