В среду наша команда открыла новый сезон научных семинаров, и первым докладчиком стал Дмитрий Андреевич Михайлов с темой: «Современные методы оптимизации: гиперпараметры и применение».

«‎Современные нейронные сети становятся все сложнее, а количество параметров в моделях постоянно растет. Оптимизаторы помогают ускорить процесс обучения, находя оптимальные веса, что напрямую влияет на качество прогнозов и производительность моделей. Без грамотной оптимизации обучение может занимать значительно больше времени и ресурсов»‎ — поделился Дмитрий Андреевич

Главные тезисы семинара: 

  1. Базовые оптимизаторы появились одновременно с нейронными сетями, однако сами алгоритмы оптимизации известны с 70-х годов 20 века. 
  2. LION — один из современных оптимизаторов, который был рассмотрен на семинаре, появился в прошлом году. Он позволяет добиться большей точности за меньшее время, чем рекомендуемое нейросетевыми фреймвоками решение — AdamW.
график ко второму тезису
график ко второму тезису
  1. Тенденция развития оптимизаторов заключается в комбинировании различных алгоритмов оптимизации с идеей взять преимущества каждого.

Использование современных оптимизаторов — это обязательный шаг для улучшения работы нейросетей. Они помогают быстрее находить оптимальные решения, повышая точность моделей и сокращая время их обучения.

* Команда DSCS.pro проводит научные семинары, где эксперты в области ИИ рассказывают последние научные открытия в области искусственного интеллекта и информационных технологий, а также делятся важными обновлениями в сфере LLM. Подключиться могут все желающие — не упустите возможность расширить свои знания и узнать о новейших подходах в IT-сфере!