OpenAI выпустила GPT-5.3-Codex — модель, которая была частично создана самим ChatGPT

Изображение: Om siva Prakash (unsplash)
Компания OpenAI объявила о выпуске GPT-5.3-Codex — новой версии флагманской модели для кодинг-агента Codex. В OpenAI сообщили, что модель получила улучшения в программировании, работе с агентными сценариями и эффективности, а также применялась внутри компании в процессе собственной разработки.
По сухим цифрам прирост в чистом программировании выглядит спокойным. На SWE-Bench Pro результат поднялся с 56,4% до 56,8% по сравнению с предыдущей генерацией. Зато в задачах вокруг кода картина уже иная.
На Terminal-Bench 2.0 модель шагнула с 64% до 77,3%. На OSWorld-Verified, где агент управляет полноценным десктопом через визуальный интерфейс, показатель вырос с 38,2% до 64,7%. Для ориентира люди на этом же тесте держатся примерно на уровне 72%. Параллельно GPT-5.3-Codex стала экономнее по токенам и быстрее примерно на 25%.
Самое любопытное начинается за пределами привычного программирования. В OpenAI описывают модель как универсального цифрового исполнителя для всего, что специалисты делают за компьютером.
Презентации, таблицы, документация, работа с настольными приложениями — агент постепенно превращается в полноценного офисного напарника. На бенчмарке GDPval, где проверяют выполнение рабочих задач сразу в 44 профессиях, результат составил 70,9%. Это тот же уровень, что и у GPT-5.2. Появился и интерактивный режим, при котором агент регулярно сообщает о ходе работы и даёт возможность вмешаться в процесс без перезапуска задачи.
Отдельного внимания заслуживает блок, связанный с кибербезопасностью. GPT-5.3-Codex стала первой моделью компании с рейтингом High по кибербезопасности во внутреннем Preparedness Framework. Её специально обучали поиску уязвимостей в коде, а параллельно запускается пилот Trusted Access for Cyber для исследователей.
На поддержку открытого программного обеспечения и критической инфраструктуры выделено $10 млн в виде API-кредитов. Сейчас модель доступна платным подписчикам ChatGPT, а выход через API заявлен на более поздний срок.
