這兩天,Clawbot 病毒式裂變,仿佛是一年前 Manus 的魅影重現(xiàn)。
同樣一夜之間站上風(fēng)口,同樣點(diǎn)燃了無數(shù)開發(fā)者對(duì)「潑天富貴」的想象,也順手把 Token 燒成了新的「硬通貨」。
最近一組數(shù)據(jù),讓人更有體感。
中國大模型數(shù)量已超過 1500 個(gè),下游開發(fā)者已經(jīng)開始「瘋狂蓋房子」。數(shù)據(jù)顯示,2024 年初,中國日均 Token 消耗量約為 1000 億;到 2025 年 6 月,這一數(shù)字已突破 30 萬億。一年半時(shí)間,增長超過 300 倍。
與三年前的 Chatbot 不同,「能干活」的 Agent 正以前所未有的強(qiáng)度,第一次把 API 調(diào)用推入「生產(chǎn)級(jí)」——
一次看似簡單的操作,背后往往是十幾次、甚至幾十次模型調(diào)用在同時(shí)發(fā)生。任何一次服務(wù)「抽風(fēng)」,都會(huì)在 Agent 鏈路中引發(fā)一場(chǎng)多米諾骨牌式崩潰。
問題在于,中國大模型 API 服務(wù)現(xiàn)狀,遠(yuǎn)比 benchmark 復(fù)雜得多。
更像是開盲盒,有人調(diào)侃說,以為自己在用「DeepSeek V3.2」,實(shí)際可能是蒸餾/量化版本。有人花了兩周時(shí)間反復(fù)測(cè)試,上線后仍遭遇性能回退。還有團(tuán)隊(duì)發(fā)現(xiàn),模型會(huì)在某些凌晨時(shí)段準(zhǔn)時(shí)「抽風(fēng)」,延遲從 300ms 飆升至 2000ms 以上,客服秒變「智障」。
這些并非個(gè)案,而是高度碎片化的大模型API服務(wù)的「縮影」。
大模型 API 服務(wù)的「黑盒」,不只是模型不可解釋,而是用戶根本不知道,服務(wù)背后跑的是什么模型、什么配置、什么質(zhì)量。清華系 AI Infra 創(chuàng)企清程極智聯(lián)合創(chuàng)始人兼產(chǎn)品副總裁師天麾告訴機(jī)器之心。
中國大模型和大模型 API 服務(wù)商本來就多。多算力、多架構(gòu)、多網(wǎng)絡(luò)并存,同一個(gè)模型,在不同服務(wù)商、不同部署方式下,往往呈現(xiàn)出顯著差異。
比如,同樣調(diào)用 DeepSeek-V3 / R1,頭部服務(wù)商可以維持毫秒級(jí)響應(yīng);而部分接入低質(zhì)量算力或優(yōu)化不足的服務(wù)商,其 TTFT(首 Token 時(shí)延)可能慢上 2~3 倍。
與此同時(shí),免費(fèi) Token、補(bǔ)貼、打包套餐的價(jià)格戰(zhàn),讓「性價(jià)比」變得更加撲朔迷離。
經(jīng)濟(jì)學(xué)家羅納德·科斯曾指出,企業(yè)與制度的出現(xiàn),本質(zhì)上是為了替代高成本的市場(chǎng)交易。當(dāng)模型服務(wù)因高度不透明與供給碎片化不斷抬升交易成本時(shí),市場(chǎng)往往會(huì)內(nèi)生出新的中介形態(tài)與制度安排,用以收斂不確定性,降低決策與交易成本。
正是在這樣的背景下,1 月 29 日,清程極智正式發(fā)布 AI Ping。這款被業(yè)內(nèi)視為「中國版 OpenRouter + Artificial Analysis」產(chǎn)品,旨在重塑大模型 API 服務(wù)秩序,將上游服務(wù)的碎片化與「黑盒」,轉(zhuǎn)化為下游用戶手中穩(wěn)定、可預(yù)期的生產(chǎn)力。
