超1萬億參數(shù)！阿里史上最大最強模型免費上線，實測幾秒完成程序員半天工作

智東西

2025-09-06 10:36:22

作者 | 李水青

編輯 | 云鵬

智東西9月6日報道，昨夜，阿里上線Qwen3系列最強模型Qwen3-Max的Preview版本，這也是阿里迄今為止最大的模型，參數(shù)量超1萬億。該模型目前已登陸阿里百煉平臺，且在通義千問應(yīng)用及Qwen Chat上免費可用。

曝英偉達又拿下一家AI創(chuàng)企，年內(nèi)4家已入囊中

據(jù)百煉平臺介紹，Qwen3-Max-Preview相較2.5系列整體通用能力有大幅度提升，中英文通用文本理解能力、復雜指令遵循能力、主觀開放任務(wù)能力、多語言能力、工具調(diào)用能力均顯著增強；模型知識幻覺更少。

曝英偉達又拿下一家AI創(chuàng)企，年內(nèi)4家已入囊中

就在昨日，Qwen官方X賬號預告了即將推出Qwen3家族中最強大、最聰明的一員。今天，這一模型正式上線，其測評結(jié)果也隨之公布。

曝英偉達又拿下一家AI創(chuàng)企，年內(nèi)4家已入囊中

據(jù)悉，Qwen3-Max-Preview在通用知識（SuperGPQA）、數(shù)學推理（AIME25）、編程（LiveCodeBench v6）、人類偏好對齊（Arena-Hard v2）以及綜合性能力評估（LiveBench）評測中，超越了Claude-Opus 4（Non-Thinking），以及Kimi-K2、DeepSeek-V3.1和阿里此前的開源最佳Qwen3-235B-A22B-Instruct-2507。

曝英偉達又拿下一家AI創(chuàng)企，年內(nèi)4家已入囊中

在AI模型聚合平臺OpenRoute上，Qwen3-Max的介紹提及：其在推理、指令執(zhí)行、多語言支持和長尾知識覆蓋方面均有顯著改進；同時在數(shù)學、編程、邏輯和科學任務(wù)中提供了更高的準確率。該模型支持超過100種語言，具有更強大的翻譯和常識推理能力，并針對檢索增強生成（RAG）和工具調(diào)用進行了優(yōu)化，但并未包含專門的“思考”模式。

曝英偉達又拿下一家AI創(chuàng)企，年內(nèi)4家已入囊中

智東西第一時間在通義千問網(wǎng)頁端上對Qwen3-Max-Preview進行了體驗，發(fā)現(xiàn)模型在文本理解以及數(shù)學、編程能力上效果出色，且響應(yīng)速度很快。

首先讓Qwen3-Max-Preview生成一個小球碰撞模擬器，我們輸入提示詞：

“一個圓里面有兩個小球，一個黑色，一個白色，白色的球隨即位置自由下落，碰到邊界會反彈，同時再生成一個隨機位置的白色小球，黑色小球碰到邊界會反彈，碰到白色的球會變大一點，請模擬一下?！?/p>

只見Qwen3-Max-Preview很快輸出了這個程序，模擬出了兩類球的運動過程，最終黑色球膨脹至把白球吞噬。

曝英偉達又拿下一家AI創(chuàng)企，年內(nèi)4家已入囊中

當我們把難度提升，讓Qwen3-Max-Preview進行一個力量與速度種群模擬，并不斷優(yōu)化這個模擬器，發(fā)現(xiàn)Qwen3-Max-Preview能夠?qū)崿F(xiàn)快速而準確的模擬，能在幾秒鐘之內(nèi)完成一個成熟程序員可能需要大半天才能完成的工作。

我們輸入提示詞：“有兩個種群，種群a注重力量的發(fā)展，種群b注重速度的發(fā)展，請模擬一下兩個種群之間的相互作用并給出說明。”

如下圖所示，即便我給出的提示詞非常模糊，Qwen3-Max-Preview依然理解到我的意思，并給出了較準確的模擬。

曝英偉達又拿下一家AI創(chuàng)企，年內(nèi)4家已入囊中

在上述模擬中，我發(fā)現(xiàn)速度型種群被干掉的太快了，于是進一步希望它們能夠具備“逃跑”能力。我輸入提示詞：“注重速度的種群被干掉的太快了，他們每個個體都應(yīng)該具備一定的躲避危險的能力。”

而后，Qwen3-Max-Preview輸出了以下“力量與速度種群模擬（增強版）”，準確模擬出了具有躲避危險能力的小球，出現(xiàn)“誰也干不掉誰”的狀況。

曝英偉達又拿下一家AI創(chuàng)企，年內(nèi)4家已入囊中

只會逃跑不會反擊，早晚還是被干掉。于是我要求速度型種群具有協(xié)作進攻能力，輸入提示詞：

“當速度型種群團結(jié)起來的時候，可以可以干掉單個的力量型個體，請加上這個能力再模擬一下。”

Qwen3-Max-Preview依然能夠很好的實現(xiàn)，輸出了“力量與速度種群模擬（協(xié)作版）”，模擬出小綠球有了協(xié)作能力后能抵御紅球的能力，但雙方態(tài)勢依然很僵持。

曝英偉達又拿下一家AI創(chuàng)企，年內(nèi)4家已入囊中

隨著模擬的進行，兩邊種群越來越少，于是我們進一步要求Qwen3-Max-Preview給它們繁衍的能力，輸入提示詞：

“當它們雙方干掉對方個體后，可以積累養(yǎng)分，繁衍自己，繼續(xù)模擬。”

于是，Qwen3-Max-Preview輸出了“力量與速度種群模擬（資源與繁衍版）”，從模擬可以看到，兩類球都自行開始裂變，在這種情況下，紅球已經(jīng)干不過綠球了。

曝英偉達又拿下一家AI創(chuàng)企，年內(nèi)4家已入囊中

于是，我又輸入：

“發(fā)現(xiàn)力量型種群太弱了，它們根本抓不到對面，請給它們也提供團隊協(xié)作的能力，可以圍捕速度型選手。”

Qwen3-Max-Preview輸出了“力量與速度種群模擬（雙向協(xié)作版）”，小綠球和小紅球分別形成抱團趨勢，從而形成了兩邊“群毆圍攻”的態(tài)勢。

曝英偉達又拿下一家AI創(chuàng)企，年內(nèi)4家已入囊中

通過這個有趣的小實驗我們發(fā)現(xiàn)，Qwen3-Max-Preview在提示詞表意很模糊的情況下，也能夠順利理解到用戶意圖。

尤其是“躲避危險”、“團結(jié)”、“協(xié)作”、“繁衍”等表述是比較抽象的，且對應(yīng)的實際含義很復雜，實現(xiàn)起來涉及調(diào)節(jié)的參數(shù)很多，但Qwen3-Max-Preview都在幾秒鐘之內(nèi)準確理解語義及背后的邏輯，并完成模擬實驗的編程，體現(xiàn)其在復雜推理、指令執(zhí)行、數(shù)學、編程等能力方面的出色能力。

由百煉平臺可知，在定價方面，Qwen3-Max-Preview支持256k上下文，根據(jù)輸入token數(shù)采取階梯計費：

輸入0-32k token價格：0.006元/千token輸入，0.024元/千token輸出。

輸入32k-128k token價格：0.01元/千token輸入，0.04元/千輸出。

輸入128k-252k token價格：0.015元/千token輸入，0.06元/token輸出。

曝英偉達又拿下一家AI創(chuàng)企，年內(nèi)4家已入囊中