華為昇騰連夜適配千問3

2025-04-29 14:14

在阿里通義千問模型Qwen3（簡稱千問3）模型開源數(shù)小時(shí)后，華為官方宣布昇騰支持千問3全系列模型部署，開發(fā)者在MindSpeed和MindIE中開箱即用，實(shí)現(xiàn)千問3的0Day適配。

據(jù)悉，千問3是國內(nèi)首個(gè)“混合推理模型”，“快思考”與“慢思考”集成進(jìn)同一個(gè)模型，對(duì)簡單需求可低算力“秒回”答案，對(duì)復(fù)雜問題可多步驟“深度思考”，大大節(jié)省算力消耗。華為官方表示，千問3的旗艦?zāi)Ｐ?Qwen3-235B-A22B 在代碼、數(shù)學(xué)、通用能力等基準(zhǔn)測(cè)試中，與 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等頂級(jí)模型相比，表現(xiàn)出極具競爭力的結(jié)果。此外，小型 MoE 模型 Qwen3-30B-A3B 的激活參數(shù)數(shù)量是 QwQ-32B 的 10%，表現(xiàn)更勝一籌，甚至像 Qwen3-4B 這樣的小模型也能匹敵 Qwen2.5-72B-Instruct 的性能。

此前華為昇騰就一直同步支持千問系列模型。昇騰MindSpeed訓(xùn)練、MindIE推理支持千問2.5、兼容主流生態(tài)的分布式并行接口等，千問3系列模型一發(fā)布即實(shí)現(xiàn)低代碼無縫遷移。