“生成式AI时代和AI的iPhone时刻已经到来。”NVIDIA创始人兼首席执行官黄仁勋在计算机图形大会SIGGRAPH上的一番话,让台下数千观众响起一片掌声。的确,生成式AI的火热让过去高深的人工智能技术如此近在咫尺,无论是企业的生产力和生产流程创新,还是人们日常生活的体验,都在智能时代迎来了质的跃迁。在各类GPT、大模型的火热背后,对高算力、高带宽等也带来了新的需求。
生成式AI时代和AI的iPhone时刻
更先进的模型、更大规模的数据集需要更低的时延、更多的内存/存储、更大的带宽、更强的处理能力,要知道,近十年在进行大规模数据模型训练时所需的计算力已经增长了数十万甚至百万倍,这种情况使得生成式AI的高质量体验需要耗费大量的专用算力、高速网络和内存,并没有实现真正的普惠。随着模型的不断更新,训练也会成为一项持续开支。同时,只有少数巨头企业才有能力构建像ChatGPT这样的超大型LLM。
【资料图】
而在SIGGRAPH期间,NVIDIA从软件、硬件和应用开发等方面,为推动生成式AI的普惠提供了更多的选择。该公司发布了GH200 Grace Hopper超级芯片平台和名为“NVIDIA AI Workbench”的全新统一工作空间,以简化NVIDIA AI平台上模型的调节和部署。此外,黄仁勋宣布将对NVIDIA Omniverse进行重大升级,加入对生成式AI和 OpenUSD的支持,“计算机图形学和AI密不可分,图形学需要AI,AI也需要图形学。AI将在虚拟世界中学习技能,于此同时,AI也可以用于创建虚拟世界。
Omniverse是一个OpenUSD原生软件平台,可以进行跨3D工具和应用的连接、描述及模拟。此次更新将加快虚拟世界和高级工作流的创建速度,推动工业数字化进程。Cesium、Convai、MoveAI、SideFX Houdini和Wonder Dynamics已通过OpenUSD接入Omniverse。此次平台更新主要升级了Omniverse Kit(用于开发原生OpenUSD应用和扩展程序的引擎),以及NVIDIA Omniverse Audio2Face基础应用和空间计算功能。
最新平台更新、Adobe Firefly的接入、OpenUSD向RealityKit的导入以及Ada架构系统将共同加速各种具有互操作性的3D工作流以及工业数字化进程
具体来说,Omniverse Kit的更新包括——模块化应用构建,全新Omniverse Kit ExtensionRegistry是一个用于访问、共享和管理Omniverse扩展程序的中央存储库,开发者可以轻松启用或关闭其应用中的功能,因此能够比以往更加轻松地利用NVIDIA提供的600多个核心Omniverse扩展程序来构建自定义应用;全新开发者模板和资源:全新应用和体验模板让刚开始使用OpenUSD和Omniverse的开发者只需要进行极少量的编码工作就能轻松上手;提升效率和用户体验:全新渲染优化功能充分利用NVIDIA RTX GPU中NVIDIA Ada Lovelace架构的各项改进,并将DLSS 3技术完全集成到Omniverse RTX渲染器中,全新AI降噪器可实现大型工业场景的实时4K路径追踪;由原生RTX驱动的空间集成:全新扩展现实(XR)开发者工具可让用户在基于Omniverse的应用中构建原生空间计算选项,使用户能够按照自己的想法灵活地体验3D项目和虚拟世界。
NVIDIA还发布了一系列面向开发者和企业的框架、资源和服务,以此加速通用场景描述(即OpenUSD)的采用。此外,NVIDIA构建了全新的Omniverse Cloud API,供开发人员更无缝地实现和部署OpenUSD工作流和应用程序。OpenUSD支持的全新Omniverse连接器已推出,为工业企业打破复杂生产流水线中的数据孤岛带来了更多的可能性。可以看到,NVIDIA正在通过NVIDIA Omniverse与新的技术组合、ChatUSD和RunUSD等云应用编程接口,以及全新NVIDIA OpenUSD开发者计划,来推进OpenUSD的发展。OpenUSD是一个3D框架,可以实现软件工具与数据类型之间的互通,从而构建虚拟世界。
上述提到的四款全新Omniverse Cloud API包括:ChatUSD,一款面向开发人员的大型语言模型copilot工具,可以回答USD知识问题或生成Python-USD代码脚本。ChatUSD借助NVIDIA提供的USD功能和Python-USD代码片段进行微调;RunUSD,其是一个Cloud API,通过检查上传文件与OpenUSD版本的兼容性,将OpenUSD文件转换为完全路径跟踪渲染的图像,并使用Omniverse Cloud生成渲染,NVIDIA OpenUSD开发者计划中的开发人员可以使用该API的演示;DeepSearch,其为LLM代理,可在海量无标记资产数据库中进行快速语义搜索;USD-GDN Publisher,其为一键式服务,可助力企业和软件制造商从USD Composer等基于Omniverse的应用向Omniverse Cloud GDN发布基于OpenUSD的高保真体验,并实时传输到网络浏览器和移动设备。
NVIDIA Omniverse开启通往OpenUSD广阔天地的大门
OpenUSD旨在更好地连接电影和动画制作流程。同时,工业应用(比如构建具有互操作性的制造设计流程、创建符合物理学的实时工厂数字孪生或训练和验证自动驾驶汽车等)也对3D框架提出了不同的要求。为了支持这些高度复杂的工业和感知AI工作负载,NVIDIA正在开发NVIDIA Omniverse(用于开发应用程序的OpenUSD原生软件平台),以及地理空间数据模型、度量组件、SimReady、OpenUSD规范等。OpenUSD地理空间数据模型让用户可以对逼真的工厂、仓库、城市乃至地球数字孪生进行模拟和计算。对于极大规模的项目,它还会考虑到地球的曲率以确保模拟符合物理学。工业应用需要合并来自许多工具和来源的数据集,每个数据集以不同的单位表示。NVIDIA正在开发一个OpenUSD度量组件,使用户能够百分之百准确地合并不同格式的数据集。
在计算终端层面,NVIDIA与全球数据中心系统制造商、工作站厂商紧密协作,推进着AI与工业制造、数据科学、内容创作等领域的应用。NVIDIA推出了搭载全新NVIDIA L40S GPU的NVIDIA OVX服务器。这款功能强大的通用数据中心处理器将通过NVIDIA Omniverse平台,加速计算密集型的复杂应用,包括AI训练与推理、3D设计与可视化、视频处理以及工业数字化等。NVIDIA OVX系统的每台服务器最多支持8块NVIDIA L40S GPU,每块GPU的显存为48GB。基于NVIDIA Ada Lovelace GPU架构的L40S搭载第四代Tensor Core和FP8 Transformer Engine,可以提供超过1.45 PFLOP的张量处理能力。对于拥有数十亿个参数和多种数据模式(如文本和视频)的复杂AI工作负载,与NVIDIA A100 Tensor Core GPU相比,L40S能够将生成式AI的推理性能和训练性能分别提高1.2倍和1.7倍。
OVX服务器采用全新NVIDIA GPU以加速训练和推理以及图形密集型工作负载,将通过戴尔科技、慧与、联想、超微等公司提供
为了支持实时渲染、产品设计、3D内容创建等高保真专业可视化工作流,NVIDIA L40S GPU搭载142颗第三代RT Core,可提供212 TFLOP的光线追踪性能,使专业创作者能够创建沉浸式的视觉体验和逼真的内容。针对计算要求严苛的工作流,如工程和科学模拟等,NVIDIA L40S搭载18176颗CUDA Core,可提供近5倍于NVIDIA A100 GPU的单精度浮点计算(FP32)性能,以加快复杂计算和数据密集型分析的速度。NVIDIA L40S将于今年秋季上市。包括华硕、戴尔科技、技嘉、慧与、联想、QCT、超微在内的全球系统构建商近期将提供搭载NVIDIA L40S GPU的OVX系统。部署L40S GPU的企业将受益于NVIDIA AI Enterprise软件,该软件发布了重大更新,能够为100多个框架、预训练模型、工具套件和软件提供生产就绪型企业级支持和安全,其中包括用于模拟的NVIDIA Modulus、用于数据科学的NVIDIA RAPIDS和用于生产型AI的NVIDIA Triton推理服务器。
除了面向数据中心的新品,NVIDIA还推出了全新NVIDIA RTX工作站,以及三款全新台式工作站Ada架构GPU——NVIDIA RTX 5000、RTX 4500和RTX 4000,为全球专业人士带来最新的AI、图形和实时渲染技术。全新RTX工作站配备4块NVIDIA RTX 6000 Ada GPU,每块GPU具有48GB显存,单个桌面工作站就可提供5828 TFLOPS的AI性能和192GBGPU显存。这些系统还可根据用户需求,配备NVIDIA AI Enterprise或Omniverse Enterprise软件,以支持各种要求严苛的生成式AI和图形密集型工作负载。
NVIDIA RTX 6000 Ada GPU、NVIDIA Omniverse和NVIDIA AI Enterprise软件将大幅提升台式工作站的性能
据了解,系统构建商将在今年秋季开始提供最多可搭载四块RTX 6000 Ada GPU,以及NVIDIA AI Enterprise和NVIDIA Omniverse Enterprise软件的RTX工作站。全新NVIDIA RTX5000 GPU已经上市,惠普、丽台科技、PNY和Ryoyo Electro等全球分销合作伙伴将陆续发货。BOXX、戴尔、惠普、联想等全球分销合作伙伴将在今年秋季开始提供NVIDIA RTX 4500和RTX 4000 GPU。
可以看到,NVIDIA通过一系列的技术和产品创新,在广泛的生态伙伴协作之下,正在快速推进生成式AI在企业、开发者群体,以及千行百业的场景应用,并且大幅降低了企业AI项目的门槛,用领先的图形技术描绘了一个崭新的AI未来,二者相互促进,融合发展。正如黄仁勋所言:“在五年前的SIGGRAPH上,NVIDIA将AI和实时光线追踪引入GPU,从此颠覆了计算机图形。不仅如此,在NVIDIA通过AI重塑计算机图形的同时,也致力于为AI重塑GPU。”