英伟达H100启用TensorRT-LLM：AI推理性能飙升-系统大师

当前位置：系统大师 > 电脑教程 > IT资讯 > 英伟达H100启用TensorRT-LLM：AI推理性能飙升

英伟达H100启用TensorRT-LLM：AI推理性能飙升

时间：2023-09-09 16:56:09

作者：admin

【本站】9月9日消息，英伟达公司今日宣布推出了一项名为TensorRT-LLM的创新项目，旨在大幅提升其Hopper系列AI GPU上的语言模型推理性能。根据英伟达的介绍，TensorRT-LLM是一款深度优化的开源库，利用了一系列尖端技术，包括SmoothQuant、FlashAttention和fMHA等，以加速处理大型语言模型，如GPT-3(175 B)、Llama Falcom(180 B)和Bloom等模型。

据悉，TensorRT-LLM的一个显著特点是引入了一种名为In-Flight Batching的调度方案，这使得GPU能够在处理大型计算密集型请求时，同时动态处理多个较小的查询。这一创新性的方案不仅提高了GPU的性能，还使得H100型号的吞吐量提高了2倍。

在性能测试方面，英伟达以A100作为基准，对比了H100和启用了TensorRT-LLM的H100。在GPT-J 6B模型的推理性能测试中，H100相比A100提升了4倍，而启用了TensorRT-LLM的H100性能更是达到了A100的8倍。而在Llama 2模型上，H100相比A100提升了2.6倍，而启用了TensorRT-LLM的H100性能则高达A100的4.6倍。

这一重大突破意味着英伟达将继续领导AI硬件领域的发展，通过优化其GPU性能，为大型语言模型等计算密集型任务提供更快速和高效的计算支持。据本站了解，这将对人工智能应用在各个领域的发展产生积极影响，为未来的科技创新打开更广阔的可能性。

热门教程

Win11每次开机会检查tpm吗？Win11每次开机是否会检查tpm详情介绍

系统之家装机大师怎么用？系统之家装机大师使用教程

Win11正式版怎么安装安卓APK应用？Win11安装安卓APK文件方法

Win10 21H1更新KB5003637后任务栏不能在底部显示怎么办？

Win11电脑下载的文件被自动删除怎么办？

Win11资源管理器的样式如何切换？Win11资源管理器样式切换方法

Win11蓝屏怎么修复？win11蓝屏修复教程

软件大小：176.94 MB

软件语言：简体中文

下载

重装教程

电脑系统如何重装

好用一键重装系统,小编告诉你如何一键安装win10系统

讲解华硕笔记本重装系统

360怎么重装系统,小编告诉你电脑使用360安全卫士怎么重装系统

东芝笔记本重装系统,小编告诉你怎么重装东芝笔记本系统

英伟达H100启用TensorRT-LLM：AI推理性能飙升

相关文章

系统之家U盘制作工具 V1.2.2021

鲁大师

钉钉

格式工厂

腾讯视频

腾讯文档

百度浏览器

百度网盘

元气壁纸

图吧工具箱