Языковые модели в задаче автоматизации оценки личностных особенностей пользователей социальных сетей

"Моя практическая работа была посвящена исследованию возможности использования языковых моделей для обработки цифровых следов пользователей в социальной сети ВКонтакте с целью предсказания результатов опросника Айзенка. Были получены текстовые посты пользователей и результаты их тестирования на 2 шкалах теста, произведена их предобработка. После того, как текстовые посты были стандартизированы, выполнен синтез эмбеддингов пользовательских постов моделью USE. Выполнено сэмплирование данных с целью балансировки экземпляров предсказываемых классов. Была предложена архитектура модели нейросети для глубокого обучения. Предложенная модель была обучена и оценена несколькими метриками. Уровень качества модели оказался довольно высоким для задачи социального анализа. Так, Accuracy по одной из шкал составил 0.65, по другой - 0.72. В качестве дальнейшей работы планируется использование выдвинутых гипотез для улучшения моделей.​"

Павел Андреевич Никитин