Методы подбора гиперпараметров алгоритмов при анализе аватаров пользователей соцсетей
-
2 курс
ТЕХНОЛОГИИ ПРОГРАММИРОВАНИЯ
-
Максим Викторович Абрамов
Научный руководитель
-
Фёдор Витальевич Бушмелёв
Куратор
Оптимизация гиперпараметров для анализа аватаров пользователей
В современных нейросетевых моделях качество работы алгоритмов во многом зависит от корректного выбора гиперпараметров. Однако их ручной подбор требует значительных временных и вычислительных ресурсов. Мой проект направлен на автоматизацию этого процесса для алгоритмов UMAP и LOF, используемых в пайплайне кластеризации аватаров пользователей.
В работе проведён сравнительный анализ методов подбора гиперпараметров: решётчатого поиска, случайного поиска, байесовской оптимизации и эволюционных алгоритмов. Наилучшие результаты показала байесовская оптимизация, обеспечившая стабильное качество кластеризации с коэффициентом силуэта до 0.575. Реализация на Python с использованием библиотек Optuna и RAPIDS позволила ускорить обработку данных за счёт GPU-вычислений.
Интересным выводом стало то, что исключение алгоритма LOF из пайплайна сократило время обработки в 2–3 раза, что важно для масштабирования решения. Полученные результаты могут быть применены для улучшения кластеризации изображений в социальных сетях, рекомендательных системах и других областях, где требуется эффективный анализ визуальных данных.
В перспективе планируется интегрировать оптимизированный пайплайн в промышленные решения и исследовать влияние других метрик на качество кластеризации.