要聞

阿里千問3登頂全球最強(qiáng)開源模型，成本僅需DeepSeek-R1三分之一

每日經(jīng)濟(jì)新聞 2025-04-29 09:43:48

每經(jīng)記者葉曉丹每經(jīng)編輯陳俊杰

每經(jīng)杭州4月29日電（記者葉曉丹）記者從阿里云獲悉，4月29日凌晨，阿里巴巴開源新一代通義千問模型Qwen3（簡稱千問3），參數(shù)量僅為DeepSeek-R1的1/3，成本大幅下降，性能全面超越R1、OpenAI-o1等全球頂尖模型，登頂全球最強(qiáng)開源模型。千問3是國內(nèi)首個(gè)“混合推理模型”，“快思考”與“慢思考”集成進(jìn)同一個(gè)模型，對簡單需求可低算力“秒回”答案，對復(fù)雜問題可多步驟“深度思考”，大大節(jié)省算力消耗。

千問3采用混合專家（MoE）架構(gòu)，總參數(shù)量235B，激活僅需22B。千問3預(yù)訓(xùn)練數(shù)據(jù)量達(dá)36T ，并在后訓(xùn)練階段多輪強(qiáng)化學(xué)習(xí)，將非思考模式無縫整合到思考模型中。千問3在推理、指令遵循、工具調(diào)用、多語言能力等方面均大幅增強(qiáng)，即創(chuàng)下所有國產(chǎn)模型及全球開源模型的性能新高：在奧數(shù)水平的AIME25測評中，千問3斬獲81.5分，刷新開源紀(jì)錄；在考察代碼能力的LiveCodeBench評測中，千問3突破70分大關(guān)，表現(xiàn)甚至超過Grok3；在評估模型人類偏好對齊的ArenaHard測評中，千問3以95.6分超越OpenAI-o1及DeepSeek-R1。性能大幅提升的同時(shí)，千問3的部署成本還大幅下降，僅需4張H20即可部署千問3滿血版，顯存占用僅為性能相近模型的三分之一。

如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。