小米羅福莉 AI 團(tuán)隊(duì)最新突破,自研 Agent 效率系統(tǒng)使算力成本直降 71.2%

來源: IT之家

  IT之家 3 月 17 日消息,據(jù)智能紀(jì)元 AGI 昨日(3 月 16 日)報(bào)道,前 DeepSeek 研究員、小米 MiMo 大模型負(fù)責(zé)人羅福莉發(fā)表論文,與北京大學(xué)聯(lián)合研發(fā)出統(tǒng)一的資源管理系統(tǒng) ARL-Tangram。

  ARL-Tangram 采用統(tǒng)一的動(dòng)作級(jí)公式和彈性調(diào)度算法,不僅滿足異構(gòu)資源約束,而且最大限度地縮短動(dòng)作完成時(shí)間(ACT),以及實(shí)現(xiàn)定制化異構(gòu)資源管理器。

  在真實(shí)世界的智能體強(qiáng)化學(xué)習(xí)任務(wù)上的評(píng)估表明,ARL-Tangram 可以將平均 ACT 提高高達(dá) 4.3 分?蓪(qiáng)化學(xué)習(xí)訓(xùn)練的步驟持續(xù)時(shí)間縮短至多 1.5 倍,并節(jié)省高達(dá) 71.2% 的外部資源。

  這是羅福莉在小米發(fā)表的第二份突破性技術(shù)成果論文。去年 10 月,小米 AI 團(tuán)隊(duì)攜手北京大學(xué)聯(lián)合發(fā)布一篇聚焦 MoE 與強(qiáng)化學(xué)習(xí)的論文,其中已經(jīng)出現(xiàn)羅福莉的名字,成為羅福莉在小米發(fā)表的首篇論文成果。

  在 2025 小米人車家全生態(tài)合作伙伴大會(huì)上,羅福莉迎來入職后首秀。她在朋友圈官宣加入小米 Xiaomi MiMo 大模型團(tuán)隊(duì):

  智能終將從語言邁向物理世界。我正在 Xiaomi MiMo,和一群富有創(chuàng)造力、才華橫溢且真誠熱愛的研究員,致力于構(gòu)建這樣的未來,全力奔赴我們心目中的 AGI!

關(guān)注同花順財(cái)經(jīng)(ths518),獲取更多機(jī)會(huì)

0

+1
  • 北信源
  • 兆易創(chuàng)新
  • 科森科技
  • 卓翼科技
  • 天融信
  • 吉視傳媒
  • 御銀股份
  • 中油資本
  • 代碼|股票名稱 最新 漲跌幅