24.06.2026
NVIDIA и Amazon Web Services расширили совместную инфраструктуру для производственных AI-нагрузок. В фокусе — новые GPU-инстансы EC2 G7, ускоренное векторное индексирование в OpenSearch Serverless и подтверждение производительности AWS для обучения моделей на NVIDIA GB300.
NVIDIA сообщила о расширении совместной работы с Amazon Web Services: в облаке AWS появились новые элементы инфраструктуры для производственных AI-нагрузок — инстансы Amazon EC2 G7 на GPU NVIDIA RTX PRO 4500 Blackwell Server Edition, GPU-ускоренное индексирование в Amazon OpenSearch Serverless на базе NVIDIA cuVS и статус NVIDIA Exemplar Cloud для AWS на платформе GB300.
G7 рассчитаны на инференс ИИ, графику, видео, VDI, пространственные вычисления и GPU-ускоренную аналитику. AWS указывает, что по сравнению с G6 новые инстансы дают до 4,6 раза более высокую производительность инференса и до 2,1 раза более высокую графическую производительность; максимальная конфигурация включает восемь GPU, 256 ГБ суммарной видеопамяти, до 700 Гбит/с сетевой пропускной способности с EFA и до 7,6 ТБ локального NVMe SSD.
Для систем RAG, семантического поиска, рекомендательных сервисов и агентных приложений важнее изменение в OpenSearch Serverless: GPU-ускоренное векторное индексирование NVIDIA cuVS стало вычислительным вариантом по умолчанию для векторных коллекций. NVIDIA заявляет об ускорении построения индексов до 10 раз и снижении стоимости до четверти по сравнению с CPU-only подходом, что должно упростить запуск векторных баз миллиардного масштаба.
Отдельно NVIDIA сообщила, что AWS получила статус Exemplar Cloud для NVIDIA GB300 в обучающих нагрузках. Это означает соответствие внутренним порогам производительности NVIDIA для эталонной AI-инфраструктуры.
Источник: blogs.nvidia.com