財通證券(601108)發(fā)布研報稱,LPU為新一代面向大模型推理階段的芯片,核心為TSP架構(gòu)。該行認為,LPU受益于低推理延時的優(yōu)異表現(xiàn),有望實現(xiàn)快速滲透,該行看好LPU的高成長性及LPU以機柜出貨時帶來的PCB機會,建議關(guān)注:智微智能(001339)(001339.SZ)(參股元川微)、星宸科技(301536)(301536.SZ)(多輪增資元川微)、滬電股份(002463)(002463.SZ)(英偉達(NVDA)PCB供應(yīng)商)、勝宏科技(300476)(300476.SZ)(英偉達(NVDA)PCB供應(yīng)商)、深南電路(002916)(002916.SZ)。
財通證券(601108)主要觀點如下:
LPU為新一代面向大模型推理階段的芯片,核心為TSP架構(gòu)
LPU是專為順序處理的計算密集型任務(wù)設(shè)計的新型芯片架構(gòu),核心在于TSP架構(gòu),包含五大功能模塊,將經(jīng)典的處理器五級流水線拆散在整個芯片內(nèi),進而消除了硬件的復(fù)雜性,使指令執(zhí)行順序和時間具有確定性。在TSP架構(gòu)下,編譯器可以直接訪問并精確控制芯片的底層硬件狀態(tài),實現(xiàn)了軟件定義硬件。
LPU可縮短大模型推理過程中的延遲,提高用戶體驗感
大模型在推理過程中會存在延遲,延遲與用戶體驗感精密掛鉤,大模型推理過程中的延遲主要在Decode階段,核心瓶頸在于內(nèi)存帶寬。LPU具備更快的內(nèi)存帶寬,可縮短大模型推理過程中的延遲。同時,基于LPU的大模型不僅具有更快的推理速度,還可以提供更具性價比的價格,可進一步提高用戶體驗感。
LPU具備廣闊的潛在發(fā)展空間,已步入量產(chǎn)初期
目前Tokens的消耗量大幅增長,2024年初我國日均Token的消耗量為1000億,2026年2月主流大模型合計日均Token消耗已到180萬億級別,Tokens消耗量快速增長,帶動推理芯片市場規(guī)模的高增長。LPU可降低大模型推理的延遲,該行認為LPU有望在推理芯片市場中逐步滲透,具有高成長性的市場空間。目前LPU已步入量產(chǎn)初期,放量在即。
風險提示:AI技術(shù)迭代不及預(yù)期的風險;大模型發(fā)展不及預(yù)期的風險;LPU行業(yè)發(fā)展不及預(yù)期的風險。
