Автоматизация извлечения и обработки данных из внешних источников для оценки карьерных траекторий выпускников топ-15 вузов

  • 2 курс

    ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ И НАУКА О ДАННЫХ

  • Максим Викторович Абрамов

    Научный руководитель​

  • Валерий Дмитриевич Олисеенко

    Куратор

 

В рамках учебной практики была поставлена цель по разработке инструмента для автоматизированного извлечения и обработки данных с платформы hh.ru, направленного на оценку карьерных траекторий выпускников топ-15 вузов. Основной задачей являлось обеспечение корректной систематизации данных и их подготовки для дальнейшего анализа, что важно для выявления ключевых закономерностей в профессиональной деятельности выпускников.

В ходе работы был реализован процесс сбора данных с использованием библиотек aiohttp и playwright, которые обеспечивают асинхронность и управление браузером для обхода возможных ограничений. Проведен краткий обзор собранных данных, включающий их распределение по отраслям, должностям и возрастом. Эксперименты показали, что автоматизация процесса позволила значительно сократить время на сбор информации и создать основу для последующего анализа карьерных траекторий.