NVIDIA выпустила средства корпоративного управления для DGX Spark

NVIDIA опубликовала инструменты и документацию Enterprise Manageability для управления парками DGX Spark и систем на GB10. Они рассчитаны на включение таких AI-узлов в обычные процессы корпоративной эксплуатации: инвентаризацию, провижининг, мониторинг, обновления, диагностику инцидентов и вывод из эксплуатации.

NVIDIA представила Enterprise Manageability для DGX Spark — компактных систем NVIDIA для локальных ИИ-нагрузок на платформе GB10. Это не функция для запуска моделей, а слой эксплуатации: устройства предлагается вести как управляемые корпоративные endpoint-системы с удаленным выполнением команд по SSH и стандартизованным выводом в JSON.

Фреймворк охватывает весь жизненный цикл оборудования: приемку и фиксацию идентификаторов, первичное развертывание, мониторинг состояния, обслуживание и обновления, сбор диагностических данных при инцидентах, а также сброс и вывод из эксплуатации. В набор входят, в частности, инструменты для инвентаризации оборудования, прошивок, драйверов и ПО, диагностики spark_diagctl.py, анализа причин перезагрузок reset_reason_reporter.py и управления обновлениями spark_updatectl.py.

По данным NVIDIA, подход не требует постоянного управляющего агента на устройстве: существующие системы оркестрации могут запускать проверки по SSH и забирать структурированный результат для CMDB, SIEM и систем мониторинга. В документации также описаны интеграционные сценарии для корпоративных инструментов, включая Canonical Landscape, Ansible и Tanium.

Отдельный акцент сделан на изолированных средах. В документации Enterprise Manageability описаны варианты кастомной установки через cloud-init, USB-носитель, локальный сервер или внутренние зеркала пакетов. Для задач безопасности предусмотрены проверки verified boot, отчетность по шифрованию данных на диске, проверка подписи APT-пакетов и формирование свидетельств при factory reset.

Источник: developer.nvidia.com

Связь с редакцией