Задача автоматизации распознавания CAPTCHA в контексте парсинга данных о статусе грузовых контейнеров при помощи CGAN архитектуры.
-
2 курс
ПРОГРАММНАЯ ИНЖЕНЕРИЯ
-
Олисеенко Валерий Дмитриевич
Научный руководитель
-
Корепанова Анастасия Андреевна
Куратор
"Моя НИР посвящена теме автоматизации распознавания CAPTCHA в контексте парсинга данных о статусе грузовых контейнеров при помощи CGAN архитектуры. В то время как задача заключалась в компаративном анализе существующих подходов к решению CAPTCHA с использованием машинного обучения, а также реализации, измерении точности и времени работы автоматического решателя способного распознать CAPTCHA, защищающие сайт компании «YML».
По итогу мне удалось обучить две нейронных сети, комбинация которых позволяет решать сложные CAPTCHA, не уступая уже существующим аналогам, однако нуждаясь при этом в значительно меньшем объеме исходных данных. Таких результатов удалось добиться за счет того, что пока одна нейросеть обучается на существующих данных, другая (CGAN) генерирует новые образцы для следующих итераций. Данный подход открывает довольно обширные возможности для дальнейшего развития этой области и говорит о возможности обучения решателя CAPTCHA, имея лишь небольшой ограниченный набор данных, гарантируя, что результат будет никак не хуже, чем у существующих подходов.
Основные выводы, которые я сделал для себя:
1. Очень важна коммуникация и слаженная работа с научным руководителем;
2. Продуманный план реализации проекта и еженедельные отчёты способствуют эффективной работе над задачей;
3. Перед началом обучения нейронных сетей необходимо изучить существующие методы машинного обучения, а также детально проанализировать исходный датасет, так как это позволяет не только упростить дальнейшую работу над задачей, но и значительно снизить размерность данных. "
Задорожный Александр Сергеевич