国产欧美日韩一区,亚洲日本一区二区三区在线,一区免费在线观看,日一区二区,国产日韩欧美精品一区,一区二区在线免费观看,日韩在线播放一区

同花順 Logo
AIME助手
問財助手
財通證券:架構(gòu)創(chuàng)新突破大模型推理延遲瓶頸 廣闊市場空間有望快速放量
2026-03-16 10:30:12
分享
文章提及標的
財通證券--
深南電路--
英偉達--
勝宏科技--
滬電股份--
星宸科技--

財通證券(601108)發(fā)布研報稱,LPU為新一代面向大模型推理階段的芯片,核心為TSP架構(gòu)。該行認為,LPU受益于低推理延時的優(yōu)異表現(xiàn),有望實現(xiàn)快速滲透,該行看好LPU的高成長性及LPU以機柜出貨時帶來的PCB機會,建議關(guān)注:智微智能(001339)(001339.SZ)(參股元川微)、星宸科技(301536)(301536.SZ)(多輪增資元川微)、滬電股份(002463)(002463.SZ)(英偉達(NVDA)PCB供應(yīng)商)、勝宏科技(300476)(300476.SZ)(英偉達(NVDA)PCB供應(yīng)商)、深南電路(002916)(002916.SZ)。

財通證券(601108)主要觀點如下:

LPU為新一代面向大模型推理階段的芯片,核心為TSP架構(gòu)

LPU是專為順序處理的計算密集型任務(wù)設(shè)計的新型芯片架構(gòu),核心在于TSP架構(gòu),包含五大功能模塊,將經(jīng)典的處理器五級流水線拆散在整個芯片內(nèi),進而消除了硬件的復(fù)雜性,使指令執(zhí)行順序和時間具有確定性。在TSP架構(gòu)下,編譯器可以直接訪問并精確控制芯片的底層硬件狀態(tài),實現(xiàn)了軟件定義硬件。

LPU可縮短大模型推理過程中的延遲,提高用戶體驗感

大模型在推理過程中會存在延遲,延遲與用戶體驗感精密掛鉤,大模型推理過程中的延遲主要在Decode階段,核心瓶頸在于內(nèi)存帶寬。LPU具備更快的內(nèi)存帶寬,可縮短大模型推理過程中的延遲。同時,基于LPU的大模型不僅具有更快的推理速度,還可以提供更具性價比的價格,可進一步提高用戶體驗感。

LPU具備廣闊的潛在發(fā)展空間,已步入量產(chǎn)初期

目前Tokens的消耗量大幅增長,2024年初我國日均Token的消耗量為1000億,2026年2月主流大模型合計日均Token消耗已到180萬億級別,Tokens消耗量快速增長,帶動推理芯片市場規(guī)模的高增長。LPU可降低大模型推理的延遲,該行認為LPU有望在推理芯片市場中逐步滲透,具有高成長性的市場空間。目前LPU已步入量產(chǎn)初期,放量在即。

風險提示:AI技術(shù)迭代不及預(yù)期的風險;大模型發(fā)展不及預(yù)期的風險;LPU行業(yè)發(fā)展不及預(yù)期的風險。

免責聲明:風險提示:本文內(nèi)容僅供參考,不代表同花順觀點。同花順各類信息服務(wù)基于人工智能算法,如有出入請以證監(jiān)會指定上市公司信息披露平臺為準。如有投資者據(jù)此操作,風險自擔,同花順對此不承擔任何責任。
homeBack返回首頁
不良信息舉報與個人信息保護咨詢專線:10100571違法和不良信息涉企侵權(quán)舉報涉算法推薦舉報專區(qū)涉青少年不良信息舉報專區(qū)

浙江同花順互聯(lián)信息技術(shù)有限公司版權(quán)所有

網(wǎng)站備案號:浙ICP備18032105號-4
證券投資咨詢服務(wù)提供:浙江同花順云軟件有限公司 (中國證監(jiān)會核發(fā)證書編號:ZX0050)
AIME
舉報舉報
反饋反饋