在阿里通義千問模型Qwen3(簡稱千問3)模型開源數(shù)小時(shí)后,華為官方宣布昇騰支持千問3全系列模型部署,開發(fā)者在MindSpeed和MindIE中開箱即用,實(shí)現(xiàn)千問3的0Day適配。
據(jù)悉,千問3是國內(nèi)首個(gè)“混合推理模型”,“快思考”與“慢思考”集成進(jìn)同一個(gè)模型,對(duì)簡單需求可低算力“秒回”答案,對(duì)復(fù)雜問題可多步驟“深度思考”,大大節(jié)省算力消耗。華為官方表示,千問3的旗艦?zāi)P?Qwen3-235B-A22B 在代碼、數(shù)學(xué)、通用能力等基準(zhǔn)測(cè)試中,與 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等頂級(jí)模型相比,表現(xiàn)出極具競爭力的結(jié)果。此外,小型 MoE 模型 Qwen3-30B-A3B 的激活參數(shù)數(shù)量是 QwQ-32B 的 10%,表現(xiàn)更勝一籌,甚至像 Qwen3-4B 這樣的小模型也能匹敵 Qwen2.5-72B-Instruct 的性能。
此前華為昇騰就一直同步支持千問系列模型。昇騰MindSpeed訓(xùn)練、MindIE推理支持千問2.5、兼容主流生態(tài)的分布式并行接口等,千問3系列模型一發(fā)布即實(shí)現(xiàn)低代碼無縫遷移。