NVIDIA推出GeForce RTX™ SUPER GPU,助力数百万用户体验生成式AI

NVIDIA今日宣布推出GeForce RTX™ SUPER台式机GPU,为用户提供超强的生成式AI性能,以及来自各大厂商的新AI笔记本,同时发布了适用于开发者和消费者的新NVIDIA RTX™加速AI软件和工具。

NVIDIA推出GeForce RTX™ SUPER GPU,助力数百万用户体验生成式AI

在拥有超过1亿RTX GPU推动AI PC时代的基础上,NVIDIA现在向用户提供了这些工具,以增强PC上的生成式AI体验:NVIDIA TensorRT™加速流行的Stable Diffusion XL模型,用于文本到图像工作流;NVIDIA RTX Remix,提供生成式AI纹理工具;NVIDIA ACE微服务以及使用DLSS 3技术的更多游戏。

AI Workbench是一个易于使用的AI开发人员统一工具包,将于本月晚些时候推出beta版本。此外,NVIDIA TensorRT-LLM(TRT-LLM),一个加速和优化最新大型语言模型(LLM)推断性能的开源库,现在支持更多预优化的PC模型。由TRT-LLM加速的“Chat with RTX”技术演示也将于本月发布,允许AI爱好者与其笔记、文档和其他内容进行交互。

NVIDIA创始人兼首席执行官黄仁勋表示:“生成式AI是计算历史上最重大的平台转变,将改变包括游戏在内的每个行业。拥有1亿多台RTX AI PC和工作站,NVIDIA是开发者和玩家享受生成式AI魔力的庞大用户基础。”

在PC上本地运行生成式AI对于隐私、延迟和成本敏感的应用至关重要。为了满足这些需求,NVIDIA正在其完整技术堆栈上提供创新,推动新体验,并构建在已经由NVIDIA RTX技术加速的500多个AI应用程序和游戏的基础上。

RTX AI PC和工作站

NVIDIA RTX GPU能够在最高性能下运行各种应用程序,为PC上的生成式AI释放全部潜力。这些GPU中的Tensor Cores显著提高了最具挑战性应用程序的AI性能。

新的GeForce RTX 40 SUPER系列显卡,包括GeForce RTX 4080 SUPER、4070 Ti SUPER和4070 SUPER,提供顶级AI性能。GeForce RTX 4080 SUPER的AI视频生成速度比GeForce RTX 3080 Ti GPU快1.5倍,图像生成速度快1.7倍。SUPER GPU中的Tensor Cores每秒提供高达836万亿次操作,为游戏、创作和日常生产力带来了变革性的AI功能。

领先的制造商,包括Acer、ASUS、Dell、HP、Lenovo、MSI、Razer和Samsung,将发布新一波RTX AI笔记本,为用户提供完整的生成式AI功能。这些新系统与使用神经处理单元相比,性能提升范围为20倍至60倍,将于本月开始发货。

搭载RTX GPU的移动工作站可运行NVIDIA AI Enterprise软件,包括TensorRT和NVIDIA RAPIDS™,以简化、安全地进行生成式AI和数据科学开发。每个NVIDIA A800 40GB Active GPU附带三年期NVIDIA AI Enterprise许可证,为AI和数据科学提供了理想的工作站开发平台。

新的PC开发者工具用于构建AI模型

为了帮助开发者快速创建、测试和定制预训练的生成式AI模型和LLM,NVIDIA最近宣布了NVIDIA AI Workbench。AI Workbench将于本月晚些时候推出beta版本,提供对Hugging Face、GitHub和NVIDIA NGC™等热门存储库的简化访问,以及简化的用户界面,使开发者能够轻松重现、协作和迁移项目。

项目可以在数据中心、公共云或NVIDIA DGX™ Cloud等几乎任何地方进行扩展,然后迁回本地RTX系统,用于推理和轻度定制。

NVIDIA与HP合作,通过将RTX加速的AI模型和软件开发工具集成到HP AI Studio中,简化了AI模型的开发。这将允许用户轻松搜索、导入和在PC和云端之间部署优化的模型。

构建用于PC用例的AI模型后,开发者可以使用NVIDIA TensorRT进行优化,充分利用RTX GPU的Tensor Cores。

NVIDIA最近通过TensorRT将文本应用扩展到基于TensorRT-LLM的Windows应用程序,这是一个用于加速LLM的开源库。TensorRT-LLM的最新更新现已推出,为PC添加了Phi-2等更多预优化模型,与其他推断后端相比,运行速度提高了最多5倍。

RTX加速的生成式AI推动新的PC体验

在CES上,NVIDIA及其开发合作伙伴将推出一系列新的基于生成式AI的PC应用程序和服务,包括:

  • NVIDIA RTX Remix:一个创建经典游戏的RTX翻新的平台。本月晚些时候推出beta版,提供生成式AI工具,可以将经典游戏的基本纹理转化为现代、4K分辨率的基于物理的渲染材质。
  • NVIDIA ACE微服务:包括生成式AI驱动的语音和动画模型,可让开发者在游戏中添加智能、动态的数字化头像。
  • TensorRT加速Stable Diffusion XL(SDXL)Turbo和潜在一致性模型,这是两种最受欢迎的稳定扩散加速方法。与先前最快实现相比,TensorRT将其性能提高了60%。TensorRT扩展的更新版本现已推出,包括SDXL、SDXL Turbo、LCM – Low-Rank Adaptation(LoRA)和改进的LoRA支持。
  • NVIDIA DLSS 3 with Frame Generation:使用AI将帧速率提高最多4倍,与原生渲染相比,将在包括《Horizon Forbidden West》、《Pax Dei》和《Dragon’s Dogma 2》在内的十几款新RTX游戏中亮相。
  • Chat with RTX:本月晚些时候推出的NVIDIA技术演示,允许AI爱好者使用一种称为检索增强生成(RAG)的流行技术,轻松连接PC LLMs到自己的数据。该演示由TensorRT-LLM加速,使用户可以快速与其笔记、文档和其他内容进行交互。它还将作为一个开源参考项目提供,以便开发者可以轻松在其应用程序中实现相同的功能。

本文来自投稿,不代表TePhone特锋手机网立场,如若转载,请注明出处:https://www.tephone.com/article/4172

(0)
聆听的头像聆听作者
上一篇 2024年1月10日 03:00:00
下一篇 2024年1月10日 04:00:00

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注