適逢AI大模型廠商在AI編程領域的競爭逐漸白熱化之際,7月23日清晨,阿里云通義團隊投下了一顆“重磅炸彈”:全新的通義千問AI編程大模型Qwen3-Coder正式開源。阿里巴巴表示,“這是我們迄今為止最具代理能力的代碼模型,編程能力登頂全球開源模型陣營!比绱吮響B(tài),足以證明阿里巴巴對這款產品的重視程度。
Qwen3-Coder正式開源
據介紹,Qwen3-Coder是千問系列模型中首個采用混合專家MoE架構的代碼模型。技術細節(jié)顯示,模型總參數量達4800億,激活參數為350億,原生支持256K token上下文,并可通過YaRN技術擴展至1M token,這意味著它可完整解析大型代碼倉庫或整本學術專著。
Qwen3-Coder在Agent能力多項評測中獲得最佳性能(SOTA)表現
在多項關鍵評測表現中,Qwen3-Coder不僅超越GPT4.1等閉源模型,更直接比肩當前全球公認最強的編程模型Claude4,堪稱驚艷:
在衡量智能體能力的WebArena(瀏覽器調用)和BFCL(工具調用)評測中,刷新開源模型紀錄,超越GPT4.1;
Qwen3-Coder在代碼占比70%的7.5T數據上預訓練,在后訓練階段進行了編程任務及智能體任務的強化學習,最終實現了通用能力、代碼能力及Agent能力的飛升:在瀏覽器調用(WebArena)、工具調用(BFCL)等Agent能力評測中,Qwen3-Coder刷新開源模型紀錄,超越GPT4.1;
更具突破性的是SWE-Bench評測——在這項考察模型自主規(guī)劃解決編程任務的權威測試中,Qwen3-Coder與Claude4打成平手。要知道Claude4此前是編程領域的王者,而開源的Qwen3-Coder實現了零差距超越。
Qwen3-Coder的實戰(zhàn)表現更令人震撼:在執(zhí)行復雜任務時,Qwen3-Coder調用工具數量是Claude的數倍。這種多工具協同能力使其在網頁開發(fā)、AI搜索等場景中表現卓越!敖柚鶴wen3-Coder,剛入行的程序員一天就能完成資深程序員一周的工作,生成一個品牌官網最快只需5分鐘!
目前,Qwen3-Coder已在魔搭社區(qū)、HuggingFace等平臺開源,全球開發(fā)者都可以免費下載使用。Qwen3-Coder很快將接入阿里的AI編程產品通義靈碼,API也已上線阿里云百煉。
為方便開發(fā)者更好地使用Qwen3-Coder,阿里云通義團隊還開源了一款命令行工具Qwen Code,可充分發(fā)揮Qwen3-Coder在代理式編程上的潛力。此外,Qwen3-Coder的API也可以和Claude Code、Cline等工具協同使用。
2025世界人工智能大會展區(qū),阿里巴巴展示“全棧AI”能力
“2019年,我們還在討論單點突破的語言模型,到2025年的今天,大模型已呈現‘周級迭代’的爆發(fā)態(tài)勢!7月27日,阿里云副總裁、大數據和智能實驗室負責人葉杰平在2025世界人工智能大會(WAIC 2025)上表示,當前AI模型技術正經歷從“漸進式創(chuàng)新”到“指數級躍遷”的歷史性轉變,以通義千問為代表的開源模型已成為這場變革的重要力量。
在年報股東信中,阿里表示,要將“Al+云”為核心的科技業(yè)務打造成阿里巴巴的第二增長曲線;未來十年,最大的增量和變量都是以AI為核心的驅動力帶來的變革。2025財年年報顯示,阿里云財年收入突破雙位數增長,AI相關產品收入連續(xù)七個季度實現三位數同比增長。
(大眾新聞·經濟導報記者 石瀟懿)
|