浙江特级黄色A大片|国产欧美日韩在线激情|成人免费久久超碰手机在线|欧美色星在线视频在线|激情综合啪啪欧美一黄片|久草av电影性无码欧美|免费国产亚洲视频|国产一级黄色a片|全球成人亮清视频一区二区三区|日韩一级成人黄色毛片

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁(yè) > 要聞 > 正文

國(guó)產(chǎn)大模型海外榜單斬獲多項(xiàng)第一!階躍星辰迎戰(zhàn)智譜、MiniMax,該如何破局?

每日經(jīng)濟(jì)新聞 2026-06-05 15:24:12

每經(jīng)記者|鄭欣蔚    每經(jīng)編輯|梁露月 畢陸名    

記者|鄭欣蔚

編輯|梁露月?畢陸名?杜波?校對(duì)|段煉

發(fā)布僅一周時(shí)間,階躍星辰最新開(kāi)源基座模型Step 3.7 Flash沖上海外熱榜,拿下了海外大模型評(píng)測(cè)平臺(tái)Artificial Analysis多個(gè)第一。4日,階躍星辰在其官方微信公眾號(hào)公布了這一消息。

《每日經(jīng)濟(jì)新聞》記者注意到,在Artificial Analysis的Output Speed(輸出速度)榜,Step 3.7 Flash以409 Tokens/s(詞元/秒)位列主流模型第一,同時(shí)在端到端響應(yīng)時(shí)長(zhǎng)(End-to-End Response Time)、智能效率(Intelligence vs.Output Speed)與速度價(jià)格比(Output Speed vs.Price)等關(guān)鍵指標(biāo)上均處于領(lǐng)先位置。此前,在該模型發(fā)布2天后,Step 3.7 Flash還登上OpenRouter Trending全球第二位,成為近期全球開(kāi)發(fā)者社區(qū)最受關(guān)注的開(kāi)源模型之一。

然而,高光之下,“百模大戰(zhàn)”的持續(xù)壓力同樣清晰:Step 3.7 Flash發(fā)布同期,與階躍星辰同為“AI六小龍”的智譜已提前推出同速率高速API(應(yīng)用程序編程接口);6月1日,MiniMax攜百萬(wàn)上下文新一代通用模型M3強(qiáng)勢(shì)卡位。

快思慢想研究院院長(zhǎng)、特邀評(píng)論員田豐在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)表示,Step 3.7 Flash的推出是階躍星辰在效率基礎(chǔ)設(shè)施這一細(xì)分賽道建立了可驗(yàn)證的技術(shù)信號(hào),但尚未形成可防御的差異化護(hù)城河?!?/span>相較于智譜、MiniMax等競(jìng)爭(zhēng)對(duì)手,階躍星辰處于‘滯后’位次。”田豐說(shuō),“滯后指的是在產(chǎn)品觸達(dá)層與開(kāi)發(fā)者生態(tài)仍存在系統(tǒng)性空缺,而非模型技術(shù)本身的落差?!?/span>

Step 3.7 Flash速度搶眼

但規(guī)?;a(chǎn)采用仍存不確定性

“模型競(jìng)爭(zhēng)正在從單純追求峰值智能,轉(zhuǎn)向追求單位成本下能夠持續(xù)交付多少有效智能。高效率Flash(通常指輕量、快速、低成本的模型版本)模型或?qū)⒉辉偈瞧炫災(zāi)P偷难a(bǔ)充,而會(huì)成為AI(人工智能)生產(chǎn)化時(shí)代最重要的基礎(chǔ)模型形態(tài)之一?!彪A躍星辰如此解釋其對(duì)Flash模型的押注。

Step 3.7 Flash自5月29日正式發(fā)布并開(kāi)源。據(jù)官方介紹,Step 3.7 Flash采用稀疏MoE架構(gòu),總參數(shù)196B+1.8B(ViT),激活參數(shù)僅11B,在模型能力、推理成本與執(zhí)行效率之間實(shí)現(xiàn)更優(yōu)平衡。與此同時(shí),最高生成速度達(dá)400 Tokens/s,適合高頻、多輪、低等待的Agent(智能體)應(yīng)用。

速度確實(shí)搶眼,但正如階躍星辰自述,Step 3.7 Flash追求的不僅僅是“更快”或者“更便宜”,而是成為一款真正“面向生產(chǎn)級(jí)Agent的高效率模型”。在階躍星辰看來(lái),隨著Agent從Demo走向真實(shí)生產(chǎn)環(huán)境,模型不只要回答問(wèn)題,更要理解復(fù)雜輸入、主動(dòng)搜索信息、穩(wěn)定調(diào)用工具,并在多輪任務(wù)中持續(xù)保持執(zhí)行軌跡。這對(duì)底層基礎(chǔ)模型提出了完全不同的要求,同時(shí),模型能力的關(guān)鍵指標(biāo)正在發(fā)生變化。

為此,Step 3.7 Flash面向生產(chǎn)級(jí)Agent優(yōu)化了四大能力:原生多模態(tài)理解執(zhí)行,可識(shí)別圖表、軟件界面、駕駛面板并拆解實(shí)操步驟;聯(lián)網(wǎng)與視覺(jué)搜索增強(qiáng),搭載圖像與全網(wǎng)檢索能力,不確定信息自主交叉核驗(yàn);高穩(wěn)定性工具調(diào)用與編排,支持瀏覽器、終端、辦公軟件等66類(lèi)工具連貫調(diào)用;全生態(tài)適配主流Agent開(kāi)發(fā)框架,兼顧云端商用與本地輕量化部署。

在“好用”這一維度上,階躍星辰亮出的“成績(jī)單”顯示,其中在τ2-bench Telecom(陶平方基準(zhǔn)中的電信客服評(píng)測(cè)領(lǐng)域)的低、中、高三檔推理難度下通過(guò)率均達(dá)到98%以上。

對(duì)于這一高分表現(xiàn),田豐在接受《每日經(jīng)濟(jì)新聞》記者采訪時(shí)解讀稱(chēng),τ2-bench測(cè)試(一款面向大語(yǔ)言模型對(duì)話智能體的評(píng)測(cè)基準(zhǔn)工具)作為目前最貼近生產(chǎn)級(jí)Agent場(chǎng)景的工具調(diào)用基準(zhǔn)之一,測(cè)試的是模型在用戶、工具、數(shù)據(jù)庫(kù)三方交互中的一致性與抗錯(cuò)能力,98%得分確實(shí)具有參考價(jià)值。

但他也潑了“一盆冷水”:τ2-bench的測(cè)試集中于零售、航空、電信等結(jié)構(gòu)化領(lǐng)域,現(xiàn)實(shí)Agent工作流中的長(zhǎng)尾場(chǎng)景(非結(jié)構(gòu)化API、動(dòng)態(tài)上下文切換、多工具串聯(lián)失敗恢復(fù))覆蓋不足;此外,Step 3.7 Flash雖然在發(fā)布2天后登上OpenRouter Trending全球第二位,但數(shù)據(jù)顯示,Step 3.7 Flash發(fā)布一周內(nèi)周Token消耗達(dá)566K,屬于中等活躍水平,尚不足以判斷規(guī)?;a(chǎn)采用。

在他看來(lái),更需要關(guān)注的信號(hào)是,未來(lái)Step 3.7 Flash能否在OpenRouter榜單中穩(wěn)定排名前列,并維持?jǐn)?shù)月的調(diào)用增長(zhǎng)曲線。

智譜、MiniMax貼身角逐

階躍星辰破局關(guān)鍵不在速度而在生態(tài)

就在階躍星辰為Step 3.7 Flash的登頂而收獲關(guān)注時(shí),智譜與MiniMax在同一時(shí)間窗口內(nèi)相繼出牌,持續(xù)的“百模大戰(zhàn)”壓力也映照出階躍星辰高光之下的陰影。

一方面,推理速度正日益在成為行業(yè)標(biāo)配,而非差異化優(yōu)勢(shì)。5月22日,即階躍星辰發(fā)布Step 3.7 Flash一周前,智譜已面向部分企業(yè)客戶推出GLM-5.1高速API“GLM-5.1-highspeed”,在保留旗艦基座能力的前提下,輸出速度同樣達(dá)到400 Tokens/s。一周時(shí)間,兩家國(guó)產(chǎn)大模型公司均創(chuàng)下幾乎同一速度紀(jì)錄。田豐指出:“這說(shuō)明400 Tokens/s已成為當(dāng)前推理系統(tǒng)工程的技術(shù)收斂點(diǎn),而非階躍星辰的獨(dú)立優(yōu)勢(shì)?!?/span>

事實(shí)上,速度賽道也從不缺少追逐者,F(xiàn)lash產(chǎn)品路線正在迎來(lái)行業(yè)的集結(jié)。例如,近期受到廣泛關(guān)注的DeepSeek-V4系列模型,同時(shí)推出Pro和Flash兩條產(chǎn)品線,兩者均支持高達(dá)100萬(wàn)Token上下文,旗艦型號(hào)主打推理峰值,F(xiàn)lash型號(hào)主打效率。

另一方面,階躍星辰雖錨定生產(chǎn)級(jí)Agent推出最新開(kāi)源基座模型,但其新模型的256K上下文窗口在面對(duì)“上下文即競(jìng)爭(zhēng)力”的長(zhǎng)程Agent場(chǎng)景時(shí),容易遭遇結(jié)構(gòu)性天花板。

Step 3.7 Flash發(fā)布3天后,MiniMax正式推出新一代通用模型M3,主打前沿Coding(編程)能力、1M超長(zhǎng)上下文、原生多模態(tài)的完整組合,與階躍星辰形成涇渭分明的技術(shù)路線。田豐認(rèn)為,MiniMax M3憑借百萬(wàn)級(jí)上下文窗口應(yīng)對(duì)復(fù)雜任務(wù)上限的瓶頸,依靠“能力完整性”支撐更高API單價(jià);階躍星辰則堅(jiān)持“單位成本下的有效智能”,錨定高頻輕量化Agent基礎(chǔ)設(shè)施。前者的能力峰值路線爭(zhēng)奪復(fù)雜任務(wù)定價(jià)權(quán),后者的速度路線鎖定基礎(chǔ)設(shè)施頻率。

“兩條路線不存在零和競(jìng)爭(zhēng),而是各自對(duì)應(yīng)Agent生產(chǎn)化的不同價(jià)值層。但階躍星辰更要警惕‘廉價(jià)但可替代’的陷阱:速度與成本的優(yōu)勢(shì)可以為階躍星辰贏得大量中低復(fù)雜度Agent場(chǎng)景,但這類(lèi)場(chǎng)景的遷移成本也低,護(hù)城河易被侵蝕?!碧镓S說(shuō)。

他進(jìn)一步指出,相較于智譜、MiniMax,階躍星辰在產(chǎn)品節(jié)奏與生態(tài)布局上存在一定滯后,這類(lèi)短板彌補(bǔ)周期遠(yuǎn)長(zhǎng)于技術(shù)迭代。滯后首先來(lái)自數(shù)次戰(zhàn)略搖擺。階躍星辰早年深耕C端(消費(fèi)者)消費(fèi)應(yīng)用,主力產(chǎn)品“冒泡鴨”停運(yùn)后,從“超級(jí)模型+超級(jí)應(yīng)用”路線倉(cāng)促切換至Agent基座研發(fā),戰(zhàn)略變更形成產(chǎn)品空窗期,資本市場(chǎng)估值隨之大幅震蕩。反觀智譜、MiniMax在IPO前就敲定清晰發(fā)展路徑:智譜依托GLM全系產(chǎn)品深耕政企MaaS(模型即服務(wù))商業(yè)化;MiniMax以Talkie等C端產(chǎn)品積累流量,構(gòu)筑全球化增長(zhǎng)飛輪,二者早早完成用戶觸點(diǎn)沉淀。

其次是開(kāi)發(fā)者生態(tài)密度的硬性差距。商業(yè)化數(shù)據(jù)直觀展現(xiàn)差距:MiniMax最新披露的業(yè)務(wù)數(shù)據(jù)顯示,其全球企業(yè)和開(kāi)發(fā)者客戶數(shù)已超百萬(wàn),較半年前增長(zhǎng)5倍,全球用戶規(guī)模約3億,過(guò)去兩個(gè)月年化經(jīng)常性收入增長(zhǎng)超過(guò)100%,這背后是其長(zhǎng)期沉淀的API調(diào)用粘性;智譜則依托CodeGeex王牌應(yīng)用牢牢鎖住編程開(kāi)發(fā)者,2026年3月,其MaaS平臺(tái)注冊(cè)用戶突破400萬(wàn),API年度經(jīng)常性收入(ARR)飆升至約17億元,較上年同期提升60倍。

“階躍星辰雖牽頭聯(lián)合十余家國(guó)產(chǎn)芯片廠商組建模芯生態(tài)聯(lián)盟,提前布局國(guó)產(chǎn)化算力適配,但合作止步于硬件基礎(chǔ)調(diào)試,沒(méi)能落地規(guī)?;渴鹋c開(kāi)發(fā)者遷移成果?!碧镓S表示,“其生態(tài)聯(lián)盟更接近供給側(cè)協(xié)同,真正的生態(tài)壁壘需要以需求側(cè)的開(kāi)發(fā)者黏性作為回路,這一閉環(huán)目前尚未形成?!?/span>

回到Step 3.7 Flash本身,這款產(chǎn)品憑借工具調(diào)用穩(wěn)定性與速度成本優(yōu)勢(shì),為階躍星辰守住了效率賽道的入場(chǎng)資格,但無(wú)力在短時(shí)間內(nèi)修復(fù)多年積累的生態(tài)欠賬。其押注Flash模型的路線有其突圍價(jià)值,可一旦全行業(yè)集體扎堆布局Flash產(chǎn)品,階躍若想不被淹沒(méi),必須在同質(zhì)化中找到那個(gè)“不可替代”的答案。

封面圖片來(lái)源:視覺(jué)中國(guó)(圖文無(wú)關(guān))CFF20LXzkOyYmal29zn37N5Bg2NQ4tyN4ylvMFyM3VmF4x90Uj4cDmoEphibia4RN55ibIXmqU1Od9w2Q5nhA08lA.png

|每日經(jīng)濟(jì)新聞 ?nbdnews? 原創(chuàng)文章|

未經(jīng)許可禁止轉(zhuǎn)載、摘編、復(fù)制及鏡像等使用

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

1

0