Автоматизация распознавания информационных стел на АЗС по видеоряду
-
2 курс
МАТЕМАТИКА И КОМПЬЮТЕРНЫЕ НАУКИ
-
Абрамов Максим Викторович
Научный руководитель
-
Бушмелёв Фёдор Витальевич
Куратор
"В этом семестре, я проходил учебную практику в лаборатории теоретических и междисциплинарных проблем информатики СПб ФИЦ РАН, в которой мне предложили принять участие в решении проблемы детекции информационных стел на заправках. В настоящий момент существуют различные приложения, отображающие местонахождения АЗС с данными о стоимости топлива, однако далеко не обо всех заправочных станциях можно получить информацию. Так, например, при построении маршрута в местах отдалённых от городов миллионников расстояние от ближайших заправок может составлять сотни километров, а учитывая значительный рост автотуризма, эта проблема является актуальной. Для её решения мною была проведена работа по дообучению современной модели детекции YOLOv8, которая способна проводить расчёты в реальном времени для определения объектов на изображении. Это позволит получать данные о местонахождении АЗС путём определения информационных заправочных стел по видеоряду при использовании камер мобильных телефонов или видеорегистраторов в реальном времени. Для достижения высокой точности определения заправочных стел мне потребовался подходящий набор данных. Я собрал более трехсот фотографий различных стел с помощью Google Maps, а также фотографии заправок в городе Санкт-Петербург из разных ракурсов и в разное время суток. Для повышения точности модели, я применил аугментацию, включающую в себя искажение качества фотографий путем размытия, добавления гауссовского шума и изменения угла поворота, что позволило расширить мой набор данных до 821 фотографии. YOLO предоставляет разные уровни предварительной обученности модели, от размера "nano" до "extra large", которые отличаются по размеру и скорости обработки изображений. Для своей работы я использовал модель "large", что позволило мне достичь точности определения практически в 70% и оптимальной скорости обработки изображений на собранном датасете. В связи с тем, что моя работа является частью проекта, в моих дальнейших планах усовершенствовать результаты, в частности, путем расширения набора данных для повышения точности детекции. Также, я надеюсь сделать модель более легкой и научить ее распознавать информацию о стоимости топлива. Эти шаги помогут улучшить качество и актуальность информации о местонахождении АЗС для водителей."
Михаил Валерьевич Морозов