Оценка личностных особенностей пользователя по данным страницы в Instagram

"Работа состоит из двух частей: разработка приложение для сбора данных, разработка трех моделей предсказывания личностных особенностей пользователя по его профилю Instagram.

Для разработки приложения была использована библиотека, представляющая собой обертку над HTTP запросами к API Instagram. Также была задействована базовая многопоточность для реализации параллельных запросов. Спроектирован графический интерфейс с использованием фреймворка PyQt5.

Во второй части учебного года был собран датасет с помощью рекрутинга респодентов. Респонденты должны пройти психологический опрос и получить пять чисел, характеризующих их как личность. Датасет представляет собой список юзернеймов и список результатов психологических тестов. Были обучены три модели, первая из которых основана на признаках, извлекаемых из фотографий, вторая --- на остальных признаках, извлекаемых из профиля, например, кол-во подписчиков, третья --- на комбинации двух предыдущих. В результате выяснилось, что вторая модель не сильно проигрывает по качеству первой и третьей, однако сложность извлечения признаков гораздо ниже, следовательно, ее применение имеет место."

Александр Андреевич Федькин