日韩久久精品视频-日韩久久精品-日韩久久高清-日韩久久av-丁香六月婷婷综合-丁香六月久久

NVIDIA RTX顯卡AI推理提速5倍 輕松搞定大模型

20231117 來源:驅(qū)動精靈 作者:驅(qū)動小精靈

驅(qū)動精靈安全、高效、專業(yè)解決各種電腦驅(qū)動問題

 

驅(qū)動界面

11月16日消息,正在舉行的微軟Iginte全球技術(shù)大會上,微軟發(fā)布一系列AI相關(guān)的全新優(yōu)化模型、開發(fā)工具資源,幫助開發(fā)者更深入地釋放硬件性能,拓展AI場景。

尤是對于當下在AI領(lǐng)域占據(jù)絕對主導地位的NVIDIA來說,微軟這次送上了一份大禮包,無論是面向OpenAI Chat API的TensorRT-LLM封裝接口,還是RTX驅(qū)動的性能改進DirectML for Llama 2,以及其他熱門大語言模型(LLM),都可以在NVIDIA硬件上獲得更好的加速和應用。

驅(qū)動精靈

 

其中,TensorRT-LLM是一款用于加速LLM推理的庫,可大大提升AI推理性能,還在不斷更以支持越來越多的語言模型,而且它還是開源的。

就在10月份,NVIDIA也發(fā)布了面向Windows平臺的TensorRT-LLM,在配備RTX 30/40系列GPU顯卡的臺式機、筆記本上,只要顯存不少于8GB,就可以更輕松地完成要求嚴苛的AI工作負載。

 

現(xiàn)在,Tensor RT-LLM for Windows可以通過全新的封裝接口,與 OpenAI 廣受歡迎的聊天 API 兼容,因此可以在本地直接運行各種相關(guān)應用,而不需要連接云端,有利于在 PC 上保留私人和專有數(shù)據(jù),防范隱私泄露。

只要是針對TensorRT-LLM優(yōu)化過的大語言模型,都可以與這一封裝接口配合使用,包括Llama 2、Mistral、NV LLM,等等。

 

對于開發(fā)者來說,無需繁瑣的代碼重寫和移植,只需修改一兩行代碼,就可以讓AI應用在本地快速執(zhí)行。

驅(qū)動精靈

本月底還會有TensorRT-LLM v0.6.0版本更新,將會在RTX GPU上帶來最多達5倍的推理性能提升,并支持更多熱門的 LLM,包括全新的70億參數(shù)Mistral、80億參數(shù)Nemotron-3,讓臺式機和筆記本也能隨時、快速、準確地本地運行LLM。

 

根據(jù)實測數(shù)據(jù),RTX 4060顯卡搭配TenroRT-LLM,推理性能可以跑到每秒319 tokens,相比其他后端的每秒61 tokens提速足足4.2倍

RTX 4090則可以從每秒tokens加速到每秒829 tokens,提升幅度達2.8倍。

驅(qū)動精靈

基于強大的硬件性能、豐富的開發(fā)生態(tài)、廣闊的應用場景,NVIDIA RTX正成為本地端側(cè)AI不可或缺的得力助手,而越來越豐富的優(yōu)化、模型和資源,也在加速AI功能、應用在上億臺RTX PC上的普及。

目前已經(jīng)有400多個合作伙伴發(fā)布了支持RTX GPU加速的AI應用、游戲,而隨著模型易用性的不斷提高,相信會有越來越多的AIGC功能出現(xiàn)在Windows PC平臺上。

驅(qū)動精靈

 

內(nèi)容來自網(wǎng)絡,如有侵權(quán),請聯(lián)系刪除

驅(qū)動精靈是國內(nèi)最早最專業(yè)的電腦驅(qū)動管理軟件,助你安全、高效解決電腦驅(qū)動問題

 


主站蜘蛛池模板: 电影土耳其狂欢| 郑俊河| 谈判专家豆瓣| 日本午夜电影| 《棋魂》电视剧| 杨国| 朱莉娅·安经典在线观看| 李亚红| 集体生活成就我教学设计| 小绿人| 沈月个人简历资料| 廊桥遗梦中被剪掉的一段| 爱情最美丽 电视剧| 甜蜜蜜演员表| 结婚唱什么歌送给新人| 明天属于我们法剧免费观看| 凤凰资讯台| 美少女巡逻队| 免费取姓名| 通灵之王| 宅基地买卖合同协议书| 张柏芝演的电视剧| 小鹏奇啪行| 第一财经直播电视直播今日股市| 公共安全教育第一课| 孙兴电影| 卢载铉| 帮妈妈做饭看图写话二年级| busty buffy| 彭丹三级裸奶视频| 建设工程监理规范最新版50319-2019| 还珠格格第一部主题曲| 赖小子| 恶行之外电影完整在线观看| 厕所英雄| 女王耳光| 礼佛大忏悔文注音版全文| 蛇欲电影| 侠侣探案| 发现一个神奇的定胆方法| 柚子猫卡夫卡的心理暗示在线观看|