阿里發(fā)布新一代基模千問(wèn)3.5,登頂全球最強(qiáng)開(kāi)源大模型
2月16日除夕當(dāng)天,阿里巴巴開(kāi)源全新一代大模型千問(wèn)Qwen3.5-Plus,性能媲美Gemini 3 Pro,登頂全球最強(qiáng)開(kāi)源模型。
據(jù)悉,千問(wèn)3.5實(shí)現(xiàn)了底層模型架構(gòu)的全面革新,此次發(fā)布的Qwen3.5-Plus版本總參數(shù)為3970億,激活僅170億,以小勝大,性能超過(guò)萬(wàn)億參數(shù)的Qwen3-Max模型,部署顯存占用降低60%,推理效率大幅提升,最大推理吞吐量可提升至19倍。Qwen3.5-Plus的API價(jià)格每百萬(wàn)Token低至0.8元,僅為Gemini 3 Pro的1/18。
與前幾代的千問(wèn)大語(yǔ)言模型不同,千問(wèn)3.5實(shí)現(xiàn)了從純文本模型到原生多模態(tài)模型的代際躍遷。千問(wèn)3預(yù)訓(xùn)練在純文本Tokens上進(jìn)行,而千問(wèn)3.5則基于視覺(jué)和文本混合token上預(yù)訓(xùn)練,并大幅新增中英文、多語(yǔ)言、STEM和推理等數(shù)據(jù),讓張開(kāi)“眼睛”的大模型學(xué)會(huì)了更密集的世界知識(shí)和推理邏輯,以不到40%的參數(shù)量獲得超萬(wàn)億的Qwen3-Max基座模型的頂尖性能,在推理、編程、Agent智能體等全方位基準(zhǔn)評(píng)估中均表現(xiàn)優(yōu)異。比如,千問(wèn)3.5在MMLU-Pro知識(shí)推理評(píng)測(cè)中得分87.8分,超越GPT-5.2;在博士級(jí)難題GPQA測(cè)評(píng)中斬獲88.4分,高于Claude 4.5;在指令遵循IFBench以76.5分刷新所有模型紀(jì)錄;而在通用Agent評(píng)測(cè)BFCL-V4、搜索Agent評(píng)測(cè)Browsecomp等基準(zhǔn)中,千問(wèn)3.5表現(xiàn)均超越Gemini 3 Pro、GPT-5.2。
原生多模態(tài)訓(xùn)練,也帶來(lái)千問(wèn)3.5的視覺(jué)能力飛躍:在多模態(tài)推理(MathVison)、通用視覺(jué)問(wèn)答VQA(RealWorldQA)、文本識(shí)別和文件理解(CC_OCR)、空間智能(RefCOCO-avg)、視頻理解(MLVU)等眾多權(quán)威評(píng)測(cè)中,千問(wèn)3.5均斬獲最佳性能。在學(xué)科解題、任務(wù)規(guī)劃與物理空間推理等任務(wù)上,千問(wèn)3.5相比千問(wèn)專項(xiàng)模型Qwen3-VL表現(xiàn)更好,空間定位推理和帶圖推理能力均大幅增強(qiáng),推理分析更精細(xì)、精準(zhǔn);在視頻理解方面,千問(wèn)3.5支持長(zhǎng)達(dá)2小時(shí)(1M token上下文)的視頻直接輸入,適用于長(zhǎng)視頻內(nèi)容分析與摘要生成;同時(shí),千問(wèn)3.5實(shí)現(xiàn)了視覺(jué)理解與代碼能力的原生融合,結(jié)合圖搜和生圖工具,可將手繪界面草圖直接轉(zhuǎn)為可用的前端代碼,一張截圖就能定位并修復(fù)UI問(wèn)題,讓視覺(jué)編程真正成為生產(chǎn)力工具。
千問(wèn)3.5的原生多模態(tài)訓(xùn)練,是在阿里云AI基礎(chǔ)設(shè)施上高效完成的。通過(guò)系列基礎(chǔ)技術(shù)創(chuàng)新,千問(wèn)3.5在文本、圖像、視頻等混合數(shù)據(jù)訓(xùn)練吞吐量,幾近100%持平純文本基座模型訓(xùn)練,大舉降低了原生多模態(tài)訓(xùn)練的難度門(mén)檻;同時(shí),通過(guò)設(shè)計(jì)精巧的FP8、FP32精度應(yīng)用策略,在訓(xùn)練穩(wěn)定擴(kuò)展到數(shù)十萬(wàn)億個(gè)token時(shí),激活內(nèi)存減少約50% ,訓(xùn)練還能提速10% ,進(jìn)一步節(jié)約了模型訓(xùn)練成本、提升了訓(xùn)練效率。
千問(wèn)3.5也實(shí)現(xiàn)了從Agent框架到Agent應(yīng)用的新突破。千問(wèn)3.5可自主操作手機(jī)與電腦,高效完成日常任務(wù),在移動(dòng)端支持更多主流APP與指令,在PC端可處理更復(fù)雜的多步驟操作,如跨應(yīng)用數(shù)據(jù)整理、自動(dòng)化流程執(zhí)行等,顯著提升操作效率。同時(shí),千問(wèn)團(tuán)隊(duì)構(gòu)建了一個(gè)可擴(kuò)展的Agent異步強(qiáng)化學(xué)習(xí)框架,端到端可加速3到5倍,并將插件式智能體Agent支持?jǐn)U展至百萬(wàn)級(jí)規(guī)模。
據(jù)悉,千問(wèn)APP、PC端已第一時(shí)間接入Qwen3.5-Plus模型。開(kāi)發(fā)者可在魔搭社區(qū)和HuggingFace下載新模型,或通過(guò)阿里云百煉直接獲取API服務(wù)。阿里很快將繼續(xù)開(kāi)源不同尺寸、不同功能的千問(wèn)3.5系列模型。性能更強(qiáng)的旗艦?zāi)P蚎wen3.5-Max不久也將發(fā)布。
0人