OpenAI представила новую модель GPT-5.4

Изображение: Zulfugar Karimov (unslash)
OpenAI представила новую языковую модель GPT-5.4. Разработчики сделали ставку на систему, способную выполнять полноценную интеллектуальную работу. Новая версия объединяет сильные стороны предыдущих поколений — программирование, сложное логическое мышление и взаимодействие с цифровыми инструментами.
Главное новшество связано с объединением двух направлений развития моделей. Ранее разработчики использовали отдельные системы. Одна отвечала за программирование, другая специализировалась на логических рассуждениях. В GPT-5.4 эти возможности собраны внутри одной архитектуры. Модель унаследовала кодинговые возможности от GPT-5.3-Codex и улучшенные reasoning-механизмы от GPT-5.2.
Проверка на практических задачах показала заметный рост производительности. На бенчмарке GDPval система выполняла рабочие задания из 44 профессий. В тестах встречались задачи, связанные с подготовкой презентаций, анализом таблиц, построением графиков и планированием расписаний. GPT-5.4 показала уровень, совпадающий с уровнем профессиональных специалистов или превышающий его в 83% случаев. Для сравнения, у GPT-5.2 аналогичный показатель составлял 70.9%.
Внутренние испытания для инвестиционного анализа тоже продемонстрировали рост эффективности. Модель получила результат 87.3%, тогда как предыдущая версия достигала 68.4%. Ещё один заметный скачок произошёл в тесте OSWorld. Этот тест проверяет способность модели управлять компьютером через скриншоты интерфейса и команды клавиатуры. GPT-5.4 достигла результата 75%, превысив человеческий показатель 72.4%. Предыдущая версия демонстрировала лишь 47.3%.
Одно из наиболее обсуждаемых изменений — увеличение контекстного окна. Теперь модель способна обрабатывать до 1 миллиона токенов за один запрос. Такой объём позволяет анализировать длинные документы, большие переписки, массивные кодовые базы и крупные наборы данных без разбиения на отдельные части. Для задач анализа информации это существенно расширяет возможности системы.
Разработчики также внедрили несколько режимов работы. Помимо стандартного варианта появилась версия Thinking. В этом режиме система тратит больше вычислительных ресурсов и времени на построение цепочки рассуждений. Такой режим рассчитан на сложные аналитические задачи. Ещё один вариант — версия Pro, ориентированная на максимальную производительность и применение в профессиональных рабочих процессах.
Система стала аккуратнее работать с фактами и допускает меньше ошибок по сравнению с предыдущими поколениями. Дополнительно улучшено взаимодействие с внешними сервисами через API. Появился новый механизм Tool Search. Его задача — находить нужные инструменты во время выполнения задачи и уменьшать расход токенов.
Раньше определения всех инструментов загружались в контекст сразу, даже если они не использовались. Это приводило к значительным затратам вычислительных ресурсов. Теперь модель получает лишь список доступных инструментов и подгружает необходимые элементы по мере работы. В тесте из 250 задач с 36 MCP-серверами этот механизм сократил расход токенов на 47% без ухудшения качества выполнения задач.
GPT-5.4 постепенно появляется в сервисах OpenAI. Модель интегрируют в ChatGPT, инструменты для разработчиков и продукты для программирования, среди которых система Codex. В компании считают, что новая архитектура приблизит создание автономных систем искусственного интеллекта, способных выполнять сложные цифровые задачи почти без участия человека.
