Данные Разработка Безопасность Инфраструктура Курсы и книги

Anthropic выпустила Claude Sonnet 5: средняя модель приблизилась к флагману Opus

CITNews

01.07.2026

Anthropic представила Claude Sonnet 5 — новую версию средней по размеру модели. По ряду тестов она приближается к более крупной Opus 4.8, а на бенчмарке офисных задач GDPval-AA v2 даже немного её обходит. Вводная цена на первые месяцы заметно ниже, чем у флагмана.

Компания Anthropic, разработчик семейства ИИ-моделей Claude, выпустила Claude Sonnet 5 — обновление средней по размеру и стоимости модели. Заявлено, что новая версия превосходит предшественницу Sonnet 4.6 по всем тестам и по части задач приближается к более крупной и дорогой Opus 4.8.

На бенчмарке GDPval-AA v2, оценивающем выполнение реальных офисных и интеллектуальных задач, Sonnet 5 набирает 1618 баллов против 1615 у Opus 4.8. По другим замерам разрыв с флагманом сокращается, но не исчезает: в тесте многодисциплинарного рассуждения Humanity's Last Exam модель показывает 57,4% с использованием инструментов, что практически совпадает с 57,9% у Opus 4.8, а в задачах на управление компьютером (OSWorld-Verified) достигает 81,2%. При этом на самых сложных задачах по программированию (например, SWE-bench Pro) Opus 4.8 сохраняет заметное преимущество.

Вводная цена через API до 31 августа 2026 года установлена на уровне $2 за миллион входных токенов и $10 за миллион выходных, после чего повышается до $3 и $15. Для сравнения, Opus 4.8 стоит $5 и $25 за миллион токенов соответственно. Разработчики отдельно отмечают, что модель специально не обучали на задачах кибербезопасности: в тесте, подготовленном совместно с Mozilla, где моделям предлагалось создать рабочие эксплойты для уже исправленных уязвимостей Firefox, Sonnet 5 не смогла собрать полноценный эксплойт.

Источник: the-decoder.com

Новости IT

1 июля 2026

В бенчмарке OpenAI впервые заметили три Pro-версии моделей GPT-5.6

1 июля 2026

Anthropic выпустила Claude Sonnet 5: средняя модель приблизилась к флагману Opus

1 июля 2026

Российская нейросеть GENATATOR размечает гены в последовательности ДНК

1 июля 2026

The Information: OpenAI вдвое снизила стоимость ответов для гостевых пользователей ChatGPT

1 июля 2026

Атака BioShocking обманывает ИИ-браузеры через «ложную реальность» и приводит к утечке данных