Автоматизация извлечения и обработки данных из внешних источников для оценки карьерных траекторий выпускников топ-15 вузов
-
2 курс
ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ И НАУКА О ДАННЫХ
-
Максим Викторович Абрамов
Научный руководитель
-
Валерий Дмитриевич Олисеенко
Куратор
В рамках учебной практики была поставлена цель по разработке инструмента для автоматизированного извлечения и обработки данных с платформы hh.ru, направленного на оценку карьерных траекторий выпускников топ-15 вузов. Основной задачей являлось обеспечение корректной систематизации данных и их подготовки для дальнейшего анализа, что важно для выявления ключевых закономерностей в профессиональной деятельности выпускников.
В ходе работы был реализован процесс сбора данных с использованием библиотек aiohttp и playwright, которые обеспечивают асинхронность и управление браузером для обхода возможных ограничений. Проведен краткий обзор собранных данных, включающий их распределение по отраслям, должностям и возрастом. Эксперименты показали, что автоматизация процесса позволила значительно сократить время на сбор информации и создать основу для последующего анализа карьерных траекторий.