AI激戰(zhàn)正酣,業(yè)界翹首梁文鋒

梁文鋒
作者/馮雨晨
當(dāng)下,各方巨頭已在AI賽道集結(jié)完畢。
互聯(lián)網(wǎng)大廠紛紛入局,野心盡顯:都想讓自家AI大模型應(yīng)用成為流量入口的霸主。而在AI大模型的賽場(chǎng)上,曾有一位核心人物備受矚目。
去年此時(shí),正是他聲名鵲起之時(shí)?;厮葜?025年春節(jié)前一周,梁文鋒帶領(lǐng)DeepSeek推出推理大模型R1,以出人意料的低成本,打造出能與全球頂尖模型抗衡的性能,東方的技術(shù)力量就此震撼全球科技領(lǐng)域。
這位出生于廣東湛江的85后,極少公開(kāi)露面,身家已超百億,其創(chuàng)立的DeepSeek在行業(yè)內(nèi)地位舉足輕重。然而,在中國(guó)AI大模型競(jìng)爭(zhēng)白熱化之際,DeepSeek卻仿佛隱匿起來(lái)。2月11日,DeepSeek僅悄然完成升級(jí),當(dāng)外界猜測(cè)“DeepSeek的新版本要發(fā)布了嗎”,梁文鋒及DeepSeek團(tuán)隊(duì)依舊保持緘默。
有時(shí),越是沉寂,越令對(duì)手忌憚。
AI戰(zhàn)事激烈,梁文鋒卻低調(diào)無(wú)聲
這是中國(guó)AI發(fā)展史上一個(gè)頗為微妙的階段。
先看大眾感受最直接的“撒錢”行動(dòng)——1月底,騰訊通過(guò)“元寶”發(fā)放10億元現(xiàn)金紅包吸引用戶,同期百度投入5億現(xiàn)金紅包推廣文心助手。很快,阿里千問(wèn)帶著30億元紅包活動(dòng)引爆奶茶店消費(fèi),字節(jié)跳動(dòng)也緊隨其后,在豆包APP推出新春抽獎(jiǎng)活動(dòng),最高可領(lǐng)取8888元現(xiàn)金紅包。
資金持續(xù)投入,用戶熱情高漲,背后是頭部AI大模型未來(lái)發(fā)展方向的激烈博弈。
產(chǎn)品層面,字節(jié)跳動(dòng)點(diǎn)燃了一把火。2月14日,字節(jié)豆包大模型2.0正式發(fā)布,而在此前的2月7日,字節(jié)的視頻模型Seedance 2.0已在全網(wǎng)引發(fā)熱議,網(wǎng)友感嘆:“文藝復(fù)興與科技革命同時(shí)降臨的時(shí)刻到了”。幾乎同一時(shí)間,阿里迅速響應(yīng),發(fā)布新一代圖像生成基礎(chǔ)模型Qwen-Image 2.0,智譜、MiniMax等企業(yè)也紛紛推出新模型。
這場(chǎng)“你來(lái)我往”的競(jìng)爭(zhēng),透著一種默契的緊張感。相比之下,曾掀起大模型開(kāi)源浪潮的DeepSeek則顯得格外冷靜。
實(shí)際上,此前已有一些相關(guān)消息傳出。
據(jù)外媒The Information報(bào)道,DeepSeek計(jì)劃在2月中旬(春節(jié)前后)發(fā)布代號(hào)為V4的新一代旗艦級(jí)AI模型,目標(biāo)直指Coding AI領(lǐng)域的領(lǐng)先地位。但隨后又有消息稱V4可能無(wú)法按時(shí)發(fā)布,且DeepSeek內(nèi)部對(duì)發(fā)布時(shí)間始終未明確回應(yīng)。
2月11日,DeepSeek悄然完成更新,將上下文窗口長(zhǎng)度從之前的128K token提升至1M(百萬(wàn))token。當(dāng)外界猜測(cè)這是否是V4的預(yù)覽版本時(shí),官方依舊保持沉默。
但這匹“不參與喧囂戰(zhàn)事”的神秘黑馬,始終吸引著外界的關(guān)注。
2026年1月,DeepSeek團(tuán)隊(duì)連續(xù)發(fā)表兩篇由梁文鋒署名的論文——mHC(流形約束超連接)和Engram(條件記憶),當(dāng)時(shí)市場(chǎng)便開(kāi)始猜測(cè):這是否與DeepSeek V4的核心技術(shù)有關(guān)?
在多數(shù)企業(yè)招聘節(jié)奏放緩的年底,DeepSeek仍在各平臺(tái)持續(xù)招人。例如,DeepSeek官方賬號(hào)在2月5日更新了產(chǎn)品經(jīng)理、客戶端研發(fā)工程師等多個(gè)崗位的招聘信息。
梁文鋒曾說(shuō):“我們很多公司習(xí)慣跟隨,而非創(chuàng)新?!比缃瘢谛袠I(yè)巨頭激烈競(jìng)爭(zhēng)之際,外界都期待著這位曾以創(chuàng)新創(chuàng)造奇跡的顛覆者梁文鋒能帶來(lái)新的突破。
縣城走出的狀元,與中國(guó)的DeepSeek時(shí)刻
中國(guó)大陸最南端的廣東湛江米歷嶺村,曾一度游客絡(luò)繹不絕。
1985年出生的梁文鋒就來(lái)自這里。父母都是當(dāng)?shù)匦W(xué)教師,他從小成績(jī)優(yōu)異,初中時(shí)便學(xué)完高中數(shù)學(xué),甚至開(kāi)始接觸大學(xué)數(shù)學(xué)內(nèi)容。但相比考試排名,父母更關(guān)注他“今天解決了什么問(wèn)題”。
這樣的成長(zhǎng)環(huán)境,與他后來(lái)在AI圈被稱為“難得擁有純粹技術(shù)理想的人”這一評(píng)價(jià)十分契合。
17歲時(shí),梁文鋒以吳川一中高考狀元的身份考入浙江大學(xué)電子信息工程專業(yè)。2007年,他繼續(xù)在浙大信息與通信工程專業(yè)讀研,師從項(xiàng)志宇教授,主要研究機(jī)器視覺(jué)領(lǐng)域。
當(dāng)時(shí),計(jì)算機(jī)專業(yè)其實(shí)相對(duì)冷門,土木、電氣自動(dòng)化、金融國(guó)貿(mào)等專業(yè)更受青睞。一種刻板印象認(rèn)為,學(xué)計(jì)算機(jī)的畢業(yè)后只能去電腦城修電腦、賣電腦,“就是個(gè)打工的”。
但梁文鋒偏偏選擇了這個(gè)專業(yè)。個(gè)人興趣與時(shí)代變革,為這位天才少年的未來(lái)埋下了伏筆。
2008年全球金融危機(jī)爆發(fā),還是學(xué)生的梁文鋒敏銳地察覺(jué)到危機(jī)背后的機(jī)遇,與同學(xué)組建團(tuán)隊(duì),開(kāi)始用機(jī)器學(xué)習(xí)技術(shù)探索全自動(dòng)量化交易。2015年,梁文鋒與浙大同學(xué)徐進(jìn)共同創(chuàng)立杭州幻方科技有限公司——這就是后來(lái)知名的幻方量化。
AI技術(shù)始終貫穿幻方量化的發(fā)展。早期,幻方的幾乎所有量化策略都采用AI模型計(jì)算;2019年和2021年,幻方分別投入超10億元建設(shè)自主研發(fā)的深度學(xué)習(xí)訓(xùn)練平臺(tái)“螢火一號(hào)”和“螢火二號(hào)”。
發(fā)展順風(fēng)順?biāo)?021年,幻方量化已成為千億規(guī)模的量化私募機(jī)構(gòu)。這一年,幻方獲得英偉達(dá)A100顯卡,其AI集群搭載的顯卡數(shù)量達(dá)到“萬(wàn)卡級(jí)別”。值得注意的是,當(dāng)時(shí)國(guó)內(nèi)擁有超1萬(wàn)枚GPU的企業(yè)寥寥無(wú)幾,除了幻方量化,其余基本都是互聯(lián)網(wǎng)大廠。
38歲這一年,在金融領(lǐng)域已取得成就的梁文鋒做出一個(gè)決定:創(chuàng)辦DeepSeek,致力于通用人工智能的研究。
在他看來(lái),這或許是滿足自己對(duì)技術(shù)世界好奇心的一部分。DeepSeek不僅要復(fù)刻當(dāng)時(shí)已名聲大噪的GPT,更要如其公司名“深度求索”一般,真正投身大模型研究,引領(lǐng)行業(yè)生態(tài)發(fā)展。
愿景很快變?yōu)楝F(xiàn)實(shí),且登場(chǎng)方式極具震撼力。2025年1月,距離春節(jié)還有一周,當(dāng)時(shí)僅有近百人的DeepSeek團(tuán)隊(duì)上線DeepSeek R1版本,并慷慨開(kāi)源。該模型推理能力可與全球頂尖模型媲美,但成本僅約幾十萬(wàn)美元,徹底打破了“頂級(jí)模型需要千萬(wàn)美元級(jí)別投入”的認(rèn)知。
至此,梁文鋒在中國(guó)AI發(fā)展史上留下了重要的一筆:“DeepSeek時(shí)刻”。
巨頭競(jìng)爭(zhēng),中國(guó)AI開(kāi)啟嶄新時(shí)代
“AI最終是要服務(wù)于人的”,這一理念如今更為迫切。
即便是一向追求技術(shù)效能、專注研究的DeepSeek,也開(kāi)始關(guān)注C端用戶的實(shí)際需求。在其近期發(fā)布的產(chǎn)品經(jīng)理崗位招聘信息中,職責(zé)部分明確寫(xiě)道:
·主導(dǎo)DeepSeek C端產(chǎn)品的功能規(guī)劃與體驗(yàn)設(shè)計(jì),敏銳捕捉用戶需求,持續(xù)推動(dòng)產(chǎn)品創(chuàng)新與體驗(yàn)優(yōu)化;
·定位并拆解問(wèn)題,降低用戶使用門檻,關(guān)注用戶增長(zhǎng),提升使用深度、粘性與轉(zhuǎn)化;
·......
過(guò)去一年多里,許多DeepSeek的C端用戶曾懷疑DeepSeek是否有產(chǎn)品經(jīng)理?!绊?yè)面和入口設(shè)計(jì)非常簡(jiǎn)單,仿佛不需要盈利”,一位DeepSeek個(gè)人用戶如此評(píng)價(jià),甚至調(diào)侃道:“它終于意識(shí)到我們C端用戶是實(shí)現(xiàn)通用人工智能(AGI)的關(guān)鍵一環(huán)了?!?/p>
與DeepSeek的內(nèi)斂不同,更急于商業(yè)化的大廠們則動(dòng)作頻頻。
比如阿里投入30億紅包讓千問(wèn)接入奶茶點(diǎn)單場(chǎng)景,看似是燒錢獲取用戶,實(shí)則是AI時(shí)代培育用戶心智的必要步驟。通過(guò)大眾熟悉的補(bǔ)貼方式,先吸引普通用戶使用千問(wèn),再讓他們逐漸意識(shí)到AI不僅能點(diǎn)單,還能“解決實(shí)際問(wèn)題”。
同樣,準(zhǔn)備登上春晚送福利的字節(jié)豆包,早已在各類生活場(chǎng)景中尋找切入點(diǎn):幫用戶搭配韓系帥哥風(fēng)格的穿搭、為寵物拍攝藝術(shù)照、輔導(dǎo)孩子寫(xiě)作業(yè)......在這些角色扮演與情感互動(dòng)中,豆包的月活躍用戶已突破2億。
種種跡象表明,大模型競(jìng)爭(zhēng)的下半場(chǎng),AI C端應(yīng)用的需求爆發(fā)點(diǎn)即將到來(lái)。
這也讓競(jìng)爭(zhēng)回歸最本質(zhì)的邏輯:誰(shuí)能解決用戶的真實(shí)需求與問(wèn)題,誰(shuí)就能成為AI時(shí)代的超級(jí)入口。
對(duì)于向來(lái)依賴流量的互聯(lián)網(wǎng)巨頭而言,這場(chǎng)競(jìng)爭(zhēng)意義重大——這是定義下一個(gè)十年互聯(lián)網(wǎng)格局的關(guān)鍵機(jī)會(huì)。
本文來(lái)自微信公眾號(hào)“投資界”,作者:馮雨晨,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com




