О проблемах поиска выбросов в задаче с одним классом
DOI:
https://doi.org/10.71310/pcam.3_67.2025.11Ключевые слова:
функции потерь, обучение без учителя, разнотипные данныеАннотация
Рассматривается поиск выбросов в задаче распознавания с одним классом. Проблемы поиска связаны с выбором функций потерь, критериев оптимизации, преобразованиями разнотипных признаков. Приведены примеры из предметных областей, в которых существуют такие проблемы. Обоснованно отсутствие методов кластерного анализа для определения выбросов и возможности их однозначной интерпретации. Многообразие вариантов анализа связано с наличием неопределённостей при подборе параметров кластеризации. В качестве дополнительных знаний о предметной области даётся анализ природы среды для объектов-выбросов. С этой целью вычисляются значения ядерной плотности распределения выбросов по локальным областям фиксированного размера. Приводится способ определения локации объектов, ближайших к центру класса. Решена задача анализа метеоданных по городу Ташкенту. Для оперативного реагирования на нарушения экологии предложен переход к решению задачи классификации с двумя классами. Считается, что один класс описывает приемлимое состояние, другой отклонение от экологических норм.
Библиографические ссылки
Борисова И.А., Кутненко О.А. Очистка данных от диагностических ошибок в признаковых пространствах большой размерности Mathematical Biology and Bioinformatics, – 2019. Т. 14. – №2. – С. 464–476. doi: http://dx.doi.org/10.17537/2019.14.464.
Игнатьев Н.А., Турсунмуротов Д.Х. Цензурирование обучающих выборок с использованием регуляризации отношений связанности объектов классов Научно-технический вестник информационных технологий, механики и оптики, – 2024. – Т. 24. – №2. – С. 322–329. doi: http://dx.doi.org/10.17586/2226-1494-2024-24-2-322-329.
Ahmed Fahim An extended DBSCAN clustering algorithm International Journal of Advanced Computer Science and Applications, – 2022. Vol. 13. – №3. – С. 245–258. doi: http://dx.doi.org/10.14569/IJACSA.2022.0130331.
Вапник В.Н. Природа статистической теории обучения / Пер. с англ. — The nature of statistical learning theory — 2nd ed. – 2000. – 324 с.
Vinod Kumar Chauhan, Kalpana Dahiya, Anuj Sharma Problem formulations and solvers in linear SVM:a review Artif Intell Rev, – 2019. – Vol. 52. – C. 803–855. doi: http://dx.doi.org/10.1007/s10462-018-9614-6.
Наврузов Э.Р. О формировании баз прецедентов для решения задач информационной безопасности Информатика. Информационная безопасность. Математика. Научный журнал. ВЕСТНИК РГГУ, – 2022. – №3. – С. 66–84. doi: http://dx.doi.org/10.28995/2686-679X-2022-3-66-84.
Игнатьев Н.А., Згуральская Е.Н. Кластерный анализ с применением обучения на основе отношений связанности и плотности распределения Вестник Томского государственного университета. Управление, вычислительная техника и информатика, – 2024. – №68. – С. 66–74. doi: http://dx.doi.org/10.17223/19988605/68/7.
Беккер Ж., Дэвис Ж. Обучение на основе положительных и необозначенных данных: Опрос. 2020 / Пер. с англ. Learning from positive and unlabeled data: A survey. – 2020. –№109. – С. 719–760.

Загрузки
Опубликован
Выпуск
Раздел
Лицензия
Copyright (c) 2025 Н.А. Игнатьев

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.