看了幾場(chǎng)世界杯淘汰賽,我對(duì)大模型競(jìng)爭(zhēng)的認(rèn)識(shí)加深了
今天凌晨1點(diǎn)多,當(dāng)英格蘭隊(duì)到了下半場(chǎng)60多分鐘還落后于剛果(金)時(shí),我們世界杯看球群的朋友已經(jīng)開(kāi)始嚴(yán)肅討論“圖赫爾是否該下課”,以及“英國(guó)足球流氓會(huì)怎么鬧事”的問(wèn)題了。然后,凱恩天神下凡,攻入一球。我們又開(kāi)始討論“能不能90分鐘結(jié)束戰(zhàn)斗,別打加時(shí)賽了”。懂球的朋友表示,可能性不大,剛果(金)的防線扎得很牢固、防守意志堅(jiān)決,看樣子還是得120分鐘決勝負(fù)。
然后,凱恩又天神下凡了,英格蘭涉險(xiǎn)過(guò)關(guān)。巧在兩次都是剛換上場(chǎng)的戈登助攻。圖赫爾一下子從下課邊緣到了封神邊緣,相當(dāng)于從跌停板被驟然拉到漲停板。不過(guò),公允的說(shuō),決定比賽的因素很簡(jiǎn)單:巨星的個(gè)人能力。
前天姆巴佩的雙響,以及哈蘭德的進(jìn)球,道理是一樣的。嚴(yán)格地說(shuō),巴西VS日本那場(chǎng)比賽,維尼修斯起到了類似作用:雖然他沒(méi)有進(jìn)球,但每次沖進(jìn)日本隊(duì)防守三區(qū)都會(huì)引發(fā)一陣混亂,充分顯示了個(gè)人能力的碾壓。日本沒(méi)有巨星,第一檔次的球星都很少,哪怕守進(jìn)了加時(shí)賽,勝率也是渺茫的——這一點(diǎn)應(yīng)承認(rèn)。
這是世界杯淘汰賽,一場(chǎng)定勝負(fù),90-120分鐘結(jié)束之后,一個(gè)繼續(xù)前進(jìn)、一個(gè)打道回府。這種場(chǎng)合只有團(tuán)隊(duì)精神是不夠的,必須有超級(jí)巨星的靈光一閃。我想起了《點(diǎn)球成金》(Moneyball),男主角依靠數(shù)據(jù)分析在常規(guī)賽高歌猛進(jìn),到了季后賽卻始終拿不下最終的錦標(biāo),電影本身給出了解答:
最優(yōu)秀的球員都有溢價(jià),依靠數(shù)據(jù)分析去淘性價(jià)比高的球員,意味著你的每個(gè)位置都不是最頂尖的。優(yōu)秀與頂尖之間,是一道鴻溝。
在淘汰賽中,你必須有能力戰(zhàn)勝任何對(duì)手,關(guān)鍵時(shí)刻一定需要球星“硬解”。這種“硬解”能力很昂貴,沒(méi)有任何高性價(jià)比的替代品。
我很喜歡《最后之舞》(The Last Dance)這部紀(jì)錄片,其中整整一集都用來(lái)描述1998年NBA總決賽的第六場(chǎng)——喬丹封神之戰(zhàn)。皮蓬一開(kāi)場(chǎng)就受傷了,主場(chǎng)作戰(zhàn)的爵士士氣高昂,喬丹下半場(chǎng)體力不支,好幾個(gè)投射都投短了,只能依靠突破和罰球得分。最后時(shí)刻,喬丹在自己投丟過(guò)好幾次的區(qū)域拔地而起,最后一投,拿下了第六個(gè)總冠軍。
爵士輸了。講道理嗎?不講。所以喬丹值3000萬(wàn)美元年薪,所有人得圍繞他建隊(duì)。其實(shí)馬龍和斯托克頓是很偉大的球員,可惜凡人和籃球之神之間確實(shí)是有差距的,不講道理的硬解能力就是最大的差距。
說(shuō)了這么多競(jìng)技體育,跟大模型有什么關(guān)系?關(guān)系可大了。最近幾天,我在朋友圈看到了好幾篇討伐Anthropic的文章,甚至直斥其為“邪惡勢(shì)力”。天下苦Anthropic久矣:定價(jià)太高,客服很差,對(duì)某些國(guó)家的用戶很不友好,新出的模型還不讓人用,等等。你用Claude的頻率越高,就越是容易對(duì)它的開(kāi)發(fā)商一肚子火,十分期待有人能取而代之。
DeepSeek V4, Kimi K2.5, GLM 5.2...誕生之時(shí)均被AI開(kāi)發(fā)者社區(qū)追捧為“Claude殺手”。這除了說(shuō)明它們有一定實(shí)力,還說(shuō)明Anthropic何等不得人心。哪怕是提價(jià)之后的DeepSeek,API價(jià)格也只有Claude的一個(gè)零頭。至于我,一個(gè)普通的Claude Pro用戶,最痛苦的就是模型額度用的太快,哪怕你不編程、只做文本分析,也跟沙漠里的降雨一樣,稍微看到個(gè)影子就沒(méi)了。
要不是Claude實(shí)在太強(qiáng)大,我懷疑世界上不會(huì)有任何人用它。這是句真話,也是句廢話,我們還可以這樣改寫(xiě):
要不是凱恩太強(qiáng)大,不會(huì)有人花1億歐元在他29歲時(shí)買他;
要不是姆巴佩太強(qiáng)大,不會(huì)到哪個(gè)球隊(duì)都混成“總監(jiān)”,主宰更衣室運(yùn)作;
要不是梅西太強(qiáng)大,2022年哪里輪得到阿根廷奪冠?
要不是哈蘭德太強(qiáng)大,挪威在世界杯淘汰賽贏球恐怕是癡人說(shuō)夢(mèng)。
我是GPT的重度用戶,有27個(gè)月不間斷的付費(fèi)歷史;就連我也從2個(gè)月前開(kāi)始叛逃到Claude(盡管還保留了GPT Plus)。因?yàn)橛行┤蝿?wù)就是只有Claude能完成,準(zhǔn)確的說(shuō),只有Claude Opus 4.7/4.8(再加上剛剛恢復(fù)使用的Fable 5)能完成。GPT就是差那么一點(diǎn)點(diǎn)意思,至于其他模型,我不想說(shuō)。
除了大家公認(rèn)的編程和Agent能力之外,對(duì)于復(fù)雜的長(zhǎng)文本,例如小說(shuō)、劇本、哲學(xué)著作、非虛構(gòu)作品的語(yǔ)義分析,Claude給我的答案也是最好的。從前有一陣子,GPT是最好的(尤其是GPT 4o時(shí)代),但是最近半年越來(lái)越不好,不是說(shuō)它退步了,而是它趕不上Claude的進(jìn)步速度。有一些言外之意只有Claude Opus看得出來(lái)。我還想指出一點(diǎn):Opus對(duì)于“互文”,即文本之間的互相引用、化用、戲仿,看得非常準(zhǔn),已經(jīng)接近相關(guān)文科專業(yè)博士生的水平,而且它看到這些事情只需要幾秒鐘而非幾天。

更便宜的模型能用嗎?能。
更便宜的模型有用嗎?有。
更便宜的模型方便嗎?方便,至少不會(huì)像Anthropic這個(gè)神經(jīng)病舉著大棒看誰(shuí)都不順眼。
更便宜的模型能完成任務(wù)嗎?嗯,這個(gè)問(wèn)題就復(fù)雜了,得看是什么任務(wù)……
萊萬(wàn)走后,舒波莫廷一度在拜仁大殺四方,為什么拜仁還要買凱恩?是舒波莫廷沒(méi)有用嗎?還是舒波莫廷不夠便宜、性價(jià)比不夠?
阿森納花1億英鎊買了賴斯,是這個(gè)世界上沒(méi)有高性價(jià)比的后腰了嗎?這個(gè)夏天,好像所有英超豪門都在以1億英鎊爭(zhēng)奪安德森,是腦子都進(jìn)水了嗎??jī)r(jià)值3000-5000萬(wàn)英鎊的后腰不好用嗎?
還有在拜仁剛打了兩個(gè)賽季好球的奧利塞,怎么皇馬突然就2億歐元求購(gòu)了?如果拜仁愿意賣,相信愿意以類似價(jià)格買入的絕不止皇馬。
答案從來(lái)不在數(shù)據(jù)分析表上,而在球場(chǎng)上。今天凌晨凱恩的兩個(gè)進(jìn)球,昨天奧利塞的兩次助攻,還有賴斯和安德森能上能下、跑滿整個(gè)球場(chǎng)的表現(xiàn),證明他們就是關(guān)鍵時(shí)刻具備硬解能力的球星。別忘了本屆歐冠,賴斯對(duì)陣皇馬竟然單場(chǎng)攻入兩粒任意球,這種不講道理的硬解能力值不值1億英鎊?
所以Anthropic就算再邪惡、再傲嬌,大家捏著鼻子也得受著。今天早上Claude Fable 5剛恢復(fù)使用,我馬上就狠狠消耗了一波模型額度。除非GPT-5.6全面發(fā)布并且水平大幅提升,否則我覺(jué)得今年之內(nèi),我最重要的生產(chǎn)力+生活輔助雙料工具仍然是Claude. 因?yàn)槲也火B(yǎng)龍蝦、沒(méi)有多少日常Agentic Worflow任務(wù),所以更便宜的大模型API對(duì)我用處不大,還是得忍痛給Anthropic送錢。
附帶說(shuō)一句,在對(duì)Gemini失去信任一個(gè)多月后,我再次成為了Google AI的付費(fèi)用戶,唯一原因是Nano Banana Pro的生圖能力。我對(duì)比了GPT Image-2和Nano Banana Pro,認(rèn)為前者在很多方面都很強(qiáng)大,但比后者還是差一點(diǎn)點(diǎn)。我希望生成國(guó)風(fēng)或日漫二次元風(fēng)格的人設(shè)和場(chǎng)景圖片,不知道為什么,GPT在這方面比較拙劣。幾乎所有專業(yè)AI漫劇公司的主力生圖模型都是Nano Banana Pro,不是因?yàn)槠渌P蜎](méi)有用,而是因?yàn)槎疾荒芊€(wěn)定的達(dá)到最高要求。
現(xiàn)在最尷尬的反而是OpenAI. 據(jù)說(shuō)Sam Altman決定推遲IPO的原因,是難以保證獲得1萬(wàn)億美元以上的估值。那么問(wèn)題來(lái)了,Anthropic上一輪融資的估值已經(jīng)是9620億美元,離1萬(wàn)億只有一步之遙;為何早在今年年初就達(dá)到8600億美元估值的OpenAI,不能更進(jìn)一步呢?
因?yàn)镚PT不再是“最優(yōu)秀的模型”,只是“優(yōu)秀的模型之一”。在文本任務(wù)和Coding方面比Claude略遜一籌,在多模態(tài)方面顯然打不過(guò)Gemini(以及Seedance)。這就好比一個(gè)球員的定位不是“超級(jí)巨星”,不具備無(wú)條件硬解能力,只是“合格的一流球員”——實(shí)際能力可能只有5-10%的差距,但這就是天與地的區(qū)別。
因?yàn)樽顝?qiáng)的模型具備定價(jià)權(quán),整個(gè)市場(chǎng)的大部分利潤(rùn)將注定被它吃掉。競(jìng)爭(zhēng)對(duì)手可以走性價(jià)比路線,但是嚴(yán)格地說(shuō),這種路線不會(huì)對(duì)“最強(qiáng)的模型”形成競(jìng)爭(zhēng),就像球隊(duì)里的輪換球員不會(huì)對(duì)超級(jí)巨星形成競(jìng)爭(zhēng)。要拿到超級(jí)巨星的薪酬,只有一條路:在實(shí)力上達(dá)到超級(jí)巨星的水平,也就是具備硬解能力。
好像所有人都不喜歡姆總,但是姆總到了世界杯就是能進(jìn)球,而奧利塞就是能給他喂球,所以這兩人就高居巨星身價(jià)榜的前列。等到有一天,姆總不能進(jìn)球了,或者進(jìn)球也改變不了命運(yùn)了,那不用任何人罵他,他自己會(huì)從神壇下來(lái)的。在皇馬其實(shí)有點(diǎn)這個(gè)意思,不過(guò)還早。
底線是:就算姆總走下神壇了,替換他的肯定是另一個(gè)1億乃至2億歐元身價(jià)的超級(jí)前鋒,而不會(huì)是好幾個(gè)3000萬(wàn)身價(jià)的前鋒之和?;蜀R用何塞盧、拜仁用舒波莫廷都是權(quán)宜之計(jì),否則球迷會(huì)造反,球隊(duì)也不可能維持最高水平的競(jìng)爭(zhēng)力。