VMware Private AI Foundation with NVIDIA - 生成式人工智能解决方案

news/2024/10/21 10:17:30

VMware Private AI Foundation with NVIDIA - 生成式人工智能解决方案

通过 NVIDIA 的加速计算以及 VMware Cloud Foundation 的虚拟基础架构管理和云管理来运行生成式 AI 工作负载

请访问原文链接:https://sysin.org/blog/vmware-private-ai-foundation-nvidia/ 查看最新版。原创作品,转载请保留出处。

作者主页:sysin.org


VMware Private AI Foundation with NVIDIA

通过联合生成式 AI 平台解锁生成式人工智能并释放生产力。解决隐私、选择、成本、性能和合规性问题。

Architecture

阅读博客

  • 产品概述
  • 资源

解锁新一代人工智能并释放生产力

  • 阅读解决方案简介

  • 阅读 IDC 白皮书

    icon-privacy1.png

  • 实现隐私、安全和合规性

    使用人工智能服务的架构方法来实现企业数据的隐私、安全和控制。

    icon-agility2.png

  • 获得加速性能

    借助 VMware Cloud Foundation 和 NVIDIA AI Enterprise 中的集成软件和硬件功能,从生成式 AI 模型中获取最佳性能。

    icon-automation.png

  • 简化生成式 AI 部署并优化成本

    利用矢量数据库、深度学习虚拟机等特殊功能,获得简化的部署体验和显着的成本效率。

构建和部署私有且安全的生成式 AI 模型

vmw-icon-data-center-extension.svg

  • 引导式部署

    通过工作负载域和相关组件的引导式部署 (sysin),显着提高部署速度

    icon-datacenter.png

  • 用于启用 RAG 工作流程的矢量数据库

    通过 PostgreSQL 上的 pgvector 支持的矢量数据库,实现数据快速查询和实时更新,以增强 LLMs 的输出。

    icon-app-volumes.png

  • 目录设置向导

    通过精心策划和优化的 AI 基础设施目录项,简化复杂项目的基础设施配置。

    icon-virtualization.png

  • GPU 监控

    通过跨集群和主机查看 GPU 资源利用率来简化 GPU 使用,从而获得优化的性能和成本。

    icon-solution-developer.png

  • 深度学习虚拟机模板

    使用预配置的深度学习虚拟机提高环境的一致性。

    icon-microservices.png

  • NVIDIA Nemo Retriever

    通过一系列 NVIDIA CUDA-X生成式 AI 微服务增强 RAG 功能 (sysin),使组织能够将自定义模型无缝连接到不同的业务数据。

    icon-lightweight-v2.png

  • NVIDIA NIM Operator

    使用 NVIDIA AI 工作流程示例简化 RAG 应用程序部署到生产中,无需重写代码。

    icon-container4.png

  • NVIDIA NIM

    通过一组易于使用的微服务实现大规模无缝 AI 推理,这些微服务旨在加速生成式 AI 在企业中的部署。

icon-usage-meter.png

  • NVIDIA GPU Operator

    自动管理将 GPU 与 Kubernetes 结合使用所需的软件的生命周期。提高 GPU 性能、利用率和遥测。

系统架构

System Architecture of VMware Private AI Foundation with NVIDIA

VMware Private AI Foundation with NVIDIA runs on top of VMware Cloud Foundation adding support for AI workloads in VI workload domains with vSphere IaaS control plane provisioned by using kubectl and VMware Aria Automation .

Example Architecture for VMware Private AI Foundation with NVIDIA

sysin

Component Description
GPU-enabled ESXi hosts ESXi hosts that configured in the following way: Have an NVIDIA GPU that is supported for VMware Private AI Foundation with NVIDIA. The GPU is shared between workloads by using the time slicing or Multi-Instance GPU (MIG) mechanism. Have the NVIDIA vGPU host manager driver installed so that you can use vGPU profiles based on MIG or time slicing.
Supervisor One or more vSphere clusters enabled for vSphere IaaS control plane so that you can run virtual machines and containers on vSphere by using the Kubernetes API. A Supervisor is a Kubernetes cluster itself, serving as the control plane to manage workload clusters and virtual machines.
Harbor registry A local image registry in a disconnected environment where you host the container images downloaded from the NVIDIA NGC catalog.
NSX Edge cluster A cluster of NSX Edge nodes that provides 2-tier north-south routing for the Supervisor and the workloads it runs.The Tier-0 gateway on the NSX Edge cluster is in active-active mode.
NVIDIA Operators NVIDIA GPU Operator. Automates the management of all NVIDIA software components needed to provision GPU to containers in a Kubernetes cluster. NVIDIA GPU Operator is deployed on a TKG cluster. NVIDIA Network Operator. NVIDIA Network Operator also helps configuring the right mellanox drivers for containers using virtual functions for high speed networking, RDMA and GPUDirect.Network Operator works together with the GPU Operator to enable GPUDirect RDMA on compatible systems. NVIDIA Network Operator is deployed on a TKG cluster.
Vector database A PostgreSQL database that has the pgvector extension enabled so that you can use it in Retrieval Augmented Generation (RAG) AI workloads.
NVIDIA Licensing Portal NVIDIA Delegated License Service (DLS) You use the NVIDIA Licensing Portal to generate a client configuration token to assign a license to the guest vGPU driver in the deep learning virtual machine and the GPU Operators on TKG clusters. In a disconnected environment or to have your workloads getting license information without using an Internet connection, you host the NVIDIA licenses locally on a Delegated License Service (DLS) appliance.
Content library Content libraries store the images for the deep learning virtual machines and for the Tanzu Kubernetes releases. You use these images for AI workload deployment within the VMware Private AI Foundation with NVIDIA environment. In a connected environment, content libraries pull their content from VMware managed public content libraries. In a disconnected environment, you must upload the required images manually or pull them from an internal content library mirror server.
NVIDIA GPU Cloud (NGC) catalog A portal for GPU-optimized containers for AI, and machine learning that are tested and ready to run on supported NVIDIA GPUs on premises on top of VMware Private AI Foundation with NVIDIA.

As a cloud administrator (sysin), you use the management components in VMware Cloud Foundation

Management Component Description
SDDC Manager You use SDDC Manager for the following tasks: Deploy a GPU-enabled VI workload domain that is based vSphere Lifecycle Manager images and add clusters to it. Deploy an NSX Edge cluster in VI workload domains for use by Supervisor instances and in the management domain for the VMware Aria Suite components of VMware Private AI Foundation with NVIDIA. Deploy a VMware Aria Suite Lifecycle instance which is integrated with the SDDC Manager repository.
VI Workload Domain vCenter Server You use this vCenter Server instance to enable and configure a Supervisor.
VI Workload Domain NSX Manager SDDC Manager uses this NSX Manager to deploy and update NSX Edge clusters.
VMware Aria Suite Lifecycle You use VMware Aria Suite Lifecycle to deploy and update VMware Aria Automation and VMware Aria Operations.
VMware Aria Automation You use VMware Aria Automation to add self-service catalog items for deploying AI workloads for DevOps engineers and data scientists.
VMware Aria Operations You use VMware Aria Operations for monitoring the GPU consumption in the GPU-enabled workload domains.
VMware Data Services Manager You use VMware Data Services Manager to create vector databases, such as a PostgreSQL database with pgvector extension.

VMware 相关组件

VMware Components in VMware Private AI Foundation with NVIDIA

VMware Cloud Foundation 5.2

The functionality of the VMware Private AI Foundation with NVIDIA solution is available across several software components.

  • VMware Cloud Foundation 5.2
  • VMware Aria Automation 8.18
  • VMware Aria Operations 8.18
  • VMware Data Services Manager 2.1

VMware Cloud Foundation 5.1

The functionality of the VMware Private AI Foundation with NVIDIA solution is available across several software components.

  • VMware Cloud Foundation 5.1.1
  • VMware Aria Automation 8.16.2 and VMware Aria Automation 8.17
  • VMware Aria Operations 8.16 and VMware Aria Operations 8.17.1
  • VMware Data Services Manager 2.0.x

准备好开始了吗?

联系 VMware

VMware Private AI Foundation with NVIDIA 支持两种用例:

  • 开发用例
    云管理员和 DevOps 工程师可以以深度学习虚拟机的形式配置 AI 工作负载,包括检索增强生成 (RAG)。数据科学家可以使用这些深度学习虚拟机进行人工智能开发。
  • 生产用例
    云管理员可以为 DevOps 工程师提供具有 NVIDIA 环境的 VMware Private AI Foundation,以便在 vSphere IaaS 控制平面上的 Tanzu Kubernetes Grid (TKG) 集群上调配生产就绪的 AI 工作负载。

相关产品:

  • VMware Cloud Foundation 5.2 - 领先的多云平台
  • VMware Aria Suite 8.18 发布 - 云管理解决方案
  • VMware Data Services Manager 2.1 - 数据库管理和数据服务管理
  • VMware vSphere 8.0 Update 3b 下载 - 企业级工作负载平台
  • VMware Tanzu Kubernetes Grid (TKG) 2.5.2 - 企业级 Kubernetes 解决方案

更多:VMware 产品下载汇总

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.ryyt.cn/news/72524.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot快速上手教程

IDEA社区版 + JDK1.8 + Maven3.9.6 + Spring2.7.18 SpringBoot3不兼容JDK1.8新建SpringBoot项目 使用SpringBoot Initializr创建 IDEA专业版可以直接创建SpringBoot项目,社区版创建可以使用网页版SpringBoot Initializr创建官方SpringBoot Initializr: https://start.spring.i…

低功耗4G模组Air780E快速入门:固件的远程升级

​ 今天我们学习Air780E快速入门之固件的远程升级,小伙伴们,学起来吧! 一、生成差分包 合宙的远程升级支持使用合宙云平台和自建服务器,此例程使用的是合宙云平台。 1.1 准备新旧版的core和脚本. 关于需要升级的core(固件),需要注意的点有: 1.1.1 需要 V1103及以上的固…

很干,但实用——4G模组供电设计及其选型推荐

​4G模组的外部电源供电设计十分重要,对系统稳定、射频性能都有直接影响。 怎么让工程师朋友们在应用开发中少走弯路呢?我将以Air780E为例,陆续分享系列实用干货。无论你是专家还是菜鸟,无论你是否使用的是合宙4G模组,都值得一看。 今天继续分享——供电设计及其选型推荐 …

Luatools新手必看:从下载开始的保姆级教程!

​作为由合宙所提供的调试工具,Luatools支持最新固件获取、固件打包、trace打印、单机烧录等功能 此工具适用于合宙所有 4G 模组和 4G + GNSS 模组。一、下载和安装 (一)运行环境要求此工具运行于win7及以上系统; 不支持 Mac和 Linux。(二)支持的模组型号Air724, 所有的 A…

关于Air780E:与服务器的加密通信操作方法

​ 今天我们来学习合宙低功耗4G模组Air780E快速入门之跟服务器之间的加密通信,伙伴们,一起学起来! 一、编写脚本 1.1 准备资料 Air780E开发板购买Air780E开发板设计资料 LuatOS-Air780E/网络加密通信程序源码demo 合宙的 TCP/UDP 测试服务器 API介绍说明 1.2 程序详解 1.2.1…

代码随想录算法训练营第一天 | 704. 二分查找、 27. 移除元素、977.有序数组的平方 (上)

1-704.二分查找 给定一个 n 个元素有序的(升序)整型数组 nums 和一个目标值 target ,写一个函数搜索 nums 中的 target,如果目标值存在返回下标,否则返回 -1。 示例 1: 输入: nums = [-1,0,3,5,9,12], target = 9 输出: 4 解释: 9 出现在 nums 中并且下标为 4 示例 2: 输…

基于BP神经网络的苦瓜生长含水量预测模型matlab仿真

1.算法运行效果图预览 (完整程序运行后无水印)T表示温度,v表示风速,h表示模型厚度 2.算法运行软件版本 matlab2022a3.部分核心程序 (完整版代码包含详细中文注释和操作步骤视频)for i = 1:13;figure;subplot(211);plot(y1{i},ro);hold onplot(Train_output1{i},b);xlabel(…

小车侧方位停车过程的动态模拟matlab仿真

1.课题概述小车侧方位停车过程的动态模拟matlab仿真。仿真得到小车的停车动画,小车移动的xy轴坐标以及角度变换。2.系统仿真结果 3.核心程序与模型 版本:MATLAB2022a%阶段3 %车轮 pause(1); for i=1:13ya1=ya1+0.5;yb1=yb1+0.5;ya2=ya2+0.5;yb2=yb2+0.5;cla; patch([Car…