首页 > 热点 > 

NVIDIA TensorRT

2025-03-10 11:58:53  来源:振衣濯足网

感谢众多用户及合作伙伴一直以来对NVIDIA TensorRT-LLM的支持。TensorRT-LLM 的 Roadmap 现已在 GitHub 上公开发布!

TensorRT-LLM

持续助力用户优化推理性能

TensorRT-LLM 可在 NVIDIA GPU上加速和优化最新大语言模型(Large Language Models)的推理性能。该开源程序库在 /NVIDIA/TensorRT-LLM GitHub 资源库中免费提供。

近期,我们收到了许多用户的积极反馈,并表示,TensorRT-LLM 不仅显著提升了性能表现,还成功地将其应用集成到各自的业务中。TensorRT-LLM 强大的性能和与时俱进的新特性,为客户带来了更多可能性。

Roadmap 现已公开发布

过往,许多用户在将 TensorRT-LLM 集成到自身软件栈的过程中,总是希望能更好地了解 TensorRT-LLM 的 Roadmap。即日起,NVIDIA 正式对外公开 TensorRT-LLM 的 Roadmap ,旨在帮助用户更好地规划产品开发方向。

我们非常高兴地能与用户分享,TensorRT-LLM 的 Roadmap 现已在 GitHub 上公开发布。您可以通过以下链接随时查阅:

https://github.com/NVIDIA/TensorRT-LLM

d88235d6-acaa-11ef-93f3-92fbcf53809c.png

图 1. NVIDIA/TensorRT-LLM GitHub 网页截屏

这份 Roadmap 将为您提供关于未来支持的功能、模型等重要信息,助力您提前部署和开发。

同时,在 Roadmap 页面的底部,您可通过反馈链接提交问题。无论是问题报告还是新功能建议,我们都期待收到您的宝贵意见。

d8915bb0-acaa-11ef-93f3-92fbcf53809c.png

图 2.Roadmap 整体框架介绍

利用 TensorRT-LLM

优化大语言模型推理

TensorRT-LLM 是一个用于优化大语言模型(LLM)推理的库。它提供最先进的优化功能,包括自定义 Attention Kernel、Inflight Batching、Paged KV Caching、量化技术(FP8、INT4 AWQ、INT8 SmoothQuant 等)以及更多功能,以让你手中的 NVIDIA GPU 能跑出极致推理性能。

TensorRT-LLM 已适配大量的流行模型。通过类似 PyTorch 的 PythonAPI,可以轻松修改和扩展这些模型以满足自定义需求。以下是已支持的模型列表。

d89b7758-acaa-11ef-93f3-92fbcf53809c.png

我们鼓励所有用户定期查阅 TensorRT-LLM Roadmap。这不仅有助于您及时了解 TensorRT-LLM 的最新动态,还能让您的产品开发与 NVIDIA 的技术创新保持同步。

  文章内容仅供阅读,不构成投资建议,请谨慎对待。投资者据此操作,风险自担。

    娱乐

    马丁内斯:我不会说C罗是否进首发,我只能说他在26人大名单里

    10月11日讯北京时间13日凌晨2:45,葡萄牙将在欧国联A联赛第3轮客场挑战波兰。出席赛前新闻发布会时,葡萄牙主帅罗伯托-马丁内斯谈到了人员备战情况。谈波兰“我认为波兰是一支敢于冒险的球队,他们喜欢

    知识

    经营店面 灶具企业要掌握好五大学问

    灶具店经营看似简单其实是一个很深的学问,同样一个地段可能你的店铺人烟稀少,而隔壁的店铺却生意红火。这就是店铺经营上的问题了。因此,灶具商家进行店面经营也需注重管理水平的不断提升。及时发现问题灶具商家到

    知识

    赞布罗塔:坎比亚索和我一样能胜任多个位置希望布雷默早日康复

    10月11日讯 近日,尤文旧将赞布罗塔接受了TMW的采访,谈到了尤文的现状。他说:“尤文选择了一位年轻的教练,他在博洛尼亚执教的时候表现很好,展现出了出色的个性与品格。阵容和球队都摆在那里,尤文在欧冠

    综合

    十大生活家电品牌:用事实说话 用实力促发展

    在生活家电行业中,大大小小的品牌众多,十大生活家电品牌如若真想在激烈的竞争中脱颖而出,还需加强修炼,颜值、实力两者都具备才是促进企业发展的关键。品牌实力品牌实力是品牌的能力和潜质,对于十大生活家电品牌