NVIDIA今日宣布推出GeForce RTX™ SUPER台式机GPU,为用户提供超强的生成式AI性能,以及来自各大厂商的新AI笔记本,同时发布了适用于开发者和消费者的新NVIDIA RTX™加速AI软件和工具。
在拥有超过1亿RTX GPU推动AI PC时代的基础上,NVIDIA现在向用户提供了这些工具,以增强PC上的生成式AI体验:NVIDIA TensorRT™加速流行的Stable Diffusion XL模型,用于文本到图像工作流;NVIDIA RTX Remix,提供生成式AI纹理工具;NVIDIA ACE微服务以及使用DLSS 3技术的更多游戏。
AI Workbench是一个易于使用的AI开发人员统一工具包,将于本月晚些时候推出beta版本。此外,NVIDIA TensorRT-LLM(TRT-LLM),一个加速和优化最新大型语言模型(LLM)推断性能的开源库,现在支持更多预优化的PC模型。由TRT-LLM加速的“Chat with RTX”技术演示也将于本月发布,允许AI爱好者与其笔记、文档和其他内容进行交互。
NVIDIA创始人兼首席执行官黄仁勋表示:“生成式AI是计算历史上最重大的平台转变,将改变包括游戏在内的每个行业。拥有1亿多台RTX AI PC和工作站,NVIDIA是开发者和玩家享受生成式AI魔力的庞大用户基础。”
在PC上本地运行生成式AI对于隐私、延迟和成本敏感的应用至关重要。为了满足这些需求,NVIDIA正在其完整技术堆栈上提供创新,推动新体验,并构建在已经由NVIDIA RTX技术加速的500多个AI应用程序和游戏的基础上。
RTX AI PC和工作站
NVIDIA RTX GPU能够在最高性能下运行各种应用程序,为PC上的生成式AI释放全部潜力。这些GPU中的Tensor Cores显著提高了最具挑战性应用程序的AI性能。
新的GeForce RTX 40 SUPER系列显卡,包括GeForce RTX 4080 SUPER、4070 Ti SUPER和4070 SUPER,提供顶级AI性能。GeForce RTX 4080 SUPER的AI视频生成速度比GeForce RTX 3080 Ti GPU快1.5倍,图像生成速度快1.7倍。SUPER GPU中的Tensor Cores每秒提供高达836万亿次操作,为游戏、创作和日常生产力带来了变革性的AI功能。
领先的制造商,包括Acer、ASUS、Dell、HP、Lenovo、MSI、Razer和Samsung,将发布新一波RTX AI笔记本,为用户提供完整的生成式AI功能。这些新系统与使用神经处理单元相比,性能提升范围为20倍至60倍,将于本月开始发货。
搭载RTX GPU的移动工作站可运行NVIDIA AI Enterprise软件,包括TensorRT和NVIDIA RAPIDS™,以简化、安全地进行生成式AI和数据科学开发。每个NVIDIA A800 40GB Active GPU附带三年期NVIDIA AI Enterprise许可证,为AI和数据科学提供了理想的工作站开发平台。
新的PC开发者工具用于构建AI模型
为了帮助开发者快速创建、测试和定制预训练的生成式AI模型和LLM,NVIDIA最近宣布了NVIDIA AI Workbench。AI Workbench将于本月晚些时候推出beta版本,提供对Hugging Face、GitHub和NVIDIA NGC™等热门存储库的简化访问,以及简化的用户界面,使开发者能够轻松重现、协作和迁移项目。
项目可以在数据中心、公共云或NVIDIA DGX™ Cloud等几乎任何地方进行扩展,然后迁回本地RTX系统,用于推理和轻度定制。
NVIDIA与HP合作,通过将RTX加速的AI模型和软件开发工具集成到HP AI Studio中,简化了AI模型的开发。这将允许用户轻松搜索、导入和在PC和云端之间部署优化的模型。
构建用于PC用例的AI模型后,开发者可以使用NVIDIA TensorRT进行优化,充分利用RTX GPU的Tensor Cores。
NVIDIA最近通过TensorRT将文本应用扩展到基于TensorRT-LLM的Windows应用程序,这是一个用于加速LLM的开源库。TensorRT-LLM的最新更新现已推出,为PC添加了Phi-2等更多预优化模型,与其他推断后端相比,运行速度提高了最多5倍。
RTX加速的生成式AI推动新的PC体验
在CES上,NVIDIA及其开发合作伙伴将推出一系列新的基于生成式AI的PC应用程序和服务,包括:
- NVIDIA RTX Remix:一个创建经典游戏的RTX翻新的平台。本月晚些时候推出beta版,提供生成式AI工具,可以将经典游戏的基本纹理转化为现代、4K分辨率的基于物理的渲染材质。
- NVIDIA ACE微服务:包括生成式AI驱动的语音和动画模型,可让开发者在游戏中添加智能、动态的数字化头像。
- TensorRT加速Stable Diffusion XL(SDXL)Turbo和潜在一致性模型,这是两种最受欢迎的稳定扩散加速方法。与先前最快实现相比,TensorRT将其性能提高了60%。TensorRT扩展的更新版本现已推出,包括SDXL、SDXL Turbo、LCM – Low-Rank Adaptation(LoRA)和改进的LoRA支持。
- NVIDIA DLSS 3 with Frame Generation:使用AI将帧速率提高最多4倍,与原生渲染相比,将在包括《Horizon Forbidden West》、《Pax Dei》和《Dragon’s Dogma 2》在内的十几款新RTX游戏中亮相。
- Chat with RTX:本月晚些时候推出的NVIDIA技术演示,允许AI爱好者使用一种称为检索增强生成(RAG)的流行技术,轻松连接PC LLMs到自己的数据。该演示由TensorRT-LLM加速,使用户可以快速与其笔记、文档和其他内容进行交互。它还将作为一个开源参考项目提供,以便开发者可以轻松在其应用程序中实现相同的功能。
本文来自投稿,不代表TePhone特锋手机网立场,如若转载,请注明出处:https://www.tephone.com/article/4172