GLM 5.1 от Z.ai обошла GPT и Claude в SWE Bench Pro и показала рекорд в автономной разработке.
Grok 4.20 от xAI уступает лидерам по интеллекту, но впечатляет точностью и контекстом до 2 млн токенов.