国产欧美日韩一区,亚洲日本一区二区三区在线,一区免费在线观看,日一区二区,国产日韩欧美精品一区,一区二区在线免费观看,日韩在线播放一区

<blockquote id="lpjpk"></blockquote>

<blockquote id="lpjpk"></blockquote>

財通證券：架構(gòu)創(chuàng)新突破大模型推理延遲瓶頸廣闊市場空間有望快速放量

2026-03-16 10:30:12

來源：智通財經(jīng)

分享

文章提及標的

財通證券--

深南電路--

英偉達--

勝宏科技--

滬電股份--

星宸科技--

財通證券（601108）發(fā)布研報稱，LPU為新一代面向大模型推理階段的芯片，核心為TSP架構(gòu)。該行認為，LPU受益于低推理延時的優(yōu)異表現(xiàn)，有望實現(xiàn)快速滲透，該行看好LPU的高成長性及LPU以機柜出貨時帶來的PCB機會，建議關(guān)注：智微智能（001339）(001339.SZ)(參股元川微)、星宸科技（301536）(301536.SZ)(多輪增資元川微)、滬電股份（002463）(002463.SZ)(英偉達（NVDA）PCB供應(yīng)商)、勝宏科技（300476）(300476.SZ)(英偉達（NVDA）PCB供應(yīng)商)、深南電路（002916）(002916.SZ)。

財通證券（601108）主要觀點如下：

LPU為新一代面向大模型推理階段的芯片，核心為TSP架構(gòu)

LPU是專為順序處理的計算密集型任務(wù)設(shè)計的新型芯片架構(gòu)，核心在于TSP架構(gòu)，包含五大功能模塊，將經(jīng)典的處理器五級流水線拆散在整個芯片內(nèi)，進而消除了硬件的復(fù)雜性，使指令執(zhí)行順序和時間具有確定性。在TSP架構(gòu)下，編譯器可以直接訪問并精確控制芯片的底層硬件狀態(tài)，實現(xiàn)了軟件定義硬件。

LPU可縮短大模型推理過程中的延遲，提高用戶體驗感

大模型在推理過程中會存在延遲，延遲與用戶體驗感精密掛鉤，大模型推理過程中的延遲主要在Decode階段，核心瓶頸在于內(nèi)存帶寬。LPU具備更快的內(nèi)存帶寬，可縮短大模型推理過程中的延遲。同時，基于LPU的大模型不僅具有更快的推理速度，還可以提供更具性價比的價格，可進一步提高用戶體驗感。

LPU具備廣闊的潛在發(fā)展空間，已步入量產(chǎn)初期

目前Tokens的消耗量大幅增長，2024年初我國日均Token的消耗量為1000億，2026年2月主流大模型合計日均Token消耗已到180萬億級別，Tokens消耗量快速增長，帶動推理芯片市場規(guī)模的高增長。LPU可降低大模型推理的延遲，該行認為LPU有望在推理芯片市場中逐步滲透，具有高成長性的市場空間。目前LPU已步入量產(chǎn)初期，放量在即。

風險提示：AI技術(shù)迭代不及預(yù)期的風險;大模型發(fā)展不及預(yù)期的風險;LPU行業(yè)發(fā)展不及預(yù)期的風險。

免責聲明：風險提示：本文內(nèi)容僅供參考，不代表同花順觀點。同花順各類信息服務(wù)基于人工智能算法，如有出入請以證監(jiān)會指定上市公司信息披露平臺為準。如有投資者據(jù)此操作，風險自擔，同花順對此不承擔任何責任。

返回首頁

投資者關(guān)系

關(guān)于同花順

聯(lián)系我們

用戶體驗計劃

不良信息舉報與個人信息保護咨詢專線：10100571違法和不良信息涉企侵權(quán)舉報涉算法推薦舉報專區(qū)涉青少年不良信息舉報專區(qū)

浙江同花順互聯(lián)信息技術(shù)有限公司版權(quán)所有

網(wǎng)站備案號：浙ICP備18032105號-4

證券投資咨詢服務(wù)提供：浙江同花順云軟件有限公司（中國證監(jiān)會核發(fā)證書編號：ZX0050）

不良信息舉報

浙江市場監(jiān)管

舉報

<samp id="rdfq3"><del id="rdfq3"><kbd id="rdfq3"></kbd></del></samp>