18 июля OpenAI анонсировала GPT-4o mini — самую доступную и компактную модель, которая отличается высокой скоростью работы и невысокой ценой.
GPT-4o mini поддерживает текстовые и графические интерфейсы, а скоро появится поддержка видео- и аудиоконтента. Модель способна обрабатывать до 128 000 входных токенов, до 16 000 выходных токенов на запрос, а ее знания актуальны на период до октября 2023 года.
Эксперты DSCS.pro рассказывают, почему новая модель сможет приобрести популярность среди пользователей:
«GPT-4o mini ожидается как модель с улучшенной производительностью, но при этом достаточно доступная (в сравнении с традиционными версиями GPT). Уже сейчас заметна быстрая генерация ответа: новая модель заменяет собой GPT 3.5 по скорости работы, но имеет более высокое качество ответа, а также (как заявляют разработчики) более актуальную Базу Знаний. Более дешёвая стоимость чем GPT 3.5 и высокие результаты в тестах (MMLU 82%) — являются хорошими показателями для использования в чат-ботах, IoT-системах и прочих интерфейсах, где требуется быстро получить ответ на вопрос пользователя», — прокомментировал Леонид Щепецков, старший инженер по разработке в блоке «Технологии» Сбера
Модель отлично подойдет на роль повседневного умного помощника, однако в вопросах обработки больших объёмов данных и чрезмерно глубокого анализа не стоит расчитывать на многое.
«Если говорить про актуальность анонсированной модели для российского рынка, то GigaChat Pro стоит 15 долларов за миллион токенов на вход, новый GPT-4o mini стоит 0,15 долларов за вход (в 100 раз меньше). Кроме того, новая модель превосходит по большинству бенчмарков конкурентов в том же сегменте, поэтому можно прогнозировать, что GPT-4o mini заменит стандартную модель 3,5 турбо для бесплатных подписчиков, что существенно улучшит работу с моделями OpenAI без подписки», — поделился Павел Никитин, руководитель направления по исследованию данных в команде Giga Parsers Сбера.
Выход GPT-4o mini расширяет возможности применения ИИ в повседневной жизни, улучшая доступность продвинутых технологий для широкой аудитории. Это также подчеркивает тенденцию к созданию более легковесных и эффективных решений, которые могут адаптироваться к различным требованиям и ресурсным ограничениям.
Но поскольку новая модель вышла совсем недавно, лишь практический опыт работы с ней покажет насколько ожидания соответствуют реальности.