01.07.2026
Anthropic представила Claude Sonnet 5 — новую версию средней по размеру модели. По ряду тестов она приближается к более крупной Opus 4.8, а на бенчмарке офисных задач GDPval-AA v2 даже немного её обходит. Вводная цена на первые месяцы заметно ниже, чем у флагмана.
Компания Anthropic, разработчик семейства ИИ-моделей Claude, выпустила Claude Sonnet 5 — обновление средней по размеру и стоимости модели. Заявлено, что новая версия превосходит предшественницу Sonnet 4.6 по всем тестам и по части задач приближается к более крупной и дорогой Opus 4.8.
На бенчмарке GDPval-AA v2, оценивающем выполнение реальных офисных и интеллектуальных задач, Sonnet 5 набирает 1618 баллов против 1615 у Opus 4.8. По другим замерам разрыв с флагманом сокращается, но не исчезает: в тесте многодисциплинарного рассуждения Humanity's Last Exam модель показывает 57,4% с использованием инструментов, что практически совпадает с 57,9% у Opus 4.8, а в задачах на управление компьютером (OSWorld-Verified) достигает 81,2%. При этом на самых сложных задачах по программированию (например, SWE-bench Pro) Opus 4.8 сохраняет заметное преимущество.
Вводная цена через API до 31 августа 2026 года установлена на уровне $2 за миллион входных токенов и $10 за миллион выходных, после чего повышается до $3 и $15. Для сравнения, Opus 4.8 стоит $5 и $25 за миллион токенов соответственно. Разработчики отдельно отмечают, что модель специально не обучали на задачах кибербезопасности: в тесте, подготовленном совместно с Mozilla, где моделям предлагалось создать рабочие эксплойты для уже исправленных уязвимостей Firefox, Sonnet 5 не смогла собрать полноценный эксплойт.
Источник: the-decoder.com