小米羅福莉 AI 團(tuán)隊(duì)最新突破,自研 Agent 效率系統(tǒng)使算力成本直降 71.2%
IT之家 3 月 17 日消息,據(jù)智能紀(jì)元 AGI 昨日(3 月 16 日)報(bào)道,前 DeepSeek 研究員、小米 MiMo 大模型負(fù)責(zé)人羅福莉發(fā)表論文,與北京大學(xué)聯(lián)合研發(fā)出統(tǒng)一的資源管理系統(tǒng) ARL-Tangram。
ARL-Tangram 采用統(tǒng)一的動(dòng)作級(jí)公式和彈性調(diào)度算法,不僅滿足異構(gòu)資源約束,而且最大限度地縮短動(dòng)作完成時(shí)間(ACT),以及實(shí)現(xiàn)定制化異構(gòu)資源管理器。
在真實(shí)世界的智能體強(qiáng)化學(xué)習(xí)任務(wù)上的評(píng)估表明,ARL-Tangram 可以將平均 ACT 提高高達(dá) 4.3 分?蓪(qiáng)化學(xué)習(xí)訓(xùn)練的步驟持續(xù)時(shí)間縮短至多 1.5 倍,并節(jié)省高達(dá) 71.2% 的外部資源。
這是羅福莉在小米發(fā)表的第二份突破性技術(shù)成果論文。去年 10 月,小米 AI 團(tuán)隊(duì)攜手北京大學(xué)聯(lián)合發(fā)布一篇聚焦 MoE 與強(qiáng)化學(xué)習(xí)的論文,其中已經(jīng)出現(xiàn)羅福莉的名字,成為羅福莉在小米發(fā)表的首篇論文成果。
在 2025 小米人車家全生態(tài)合作伙伴大會(huì)上,羅福莉迎來入職后首秀。她在朋友圈官宣加入小米 Xiaomi MiMo 大模型團(tuán)隊(duì):
智能終將從語言邁向物理世界。我正在 Xiaomi MiMo,和一群富有創(chuàng)造力、才華橫溢且真誠熱愛的研究員,致力于構(gòu)建這樣的未來,全力奔赴我們心目中的 AGI!
0人