DeepSeek-V4發(fā)布:普通人需了解的六件關(guān)鍵事
本文來(lái)自微信公眾號(hào):快刀青衣,作者:快刀青衣
百萬(wàn)上下文,從「頂級(jí)配置」變?yōu)椤溉粘;A(chǔ)服務(wù)」。
2026年4月24日,一個(gè)普通的周五,DeepSeek終于推出了V4版本。
沒(méi)有盛大的發(fā)布會(huì),沒(méi)有多人直播,沒(méi)有倒計(jì)時(shí)預(yù)熱,也未接受任何媒體采訪。官網(wǎng)悄然更新,App低調(diào)上線,API同步升級(jí),開(kāi)源模型直接上傳至HuggingFace。唯一的宣傳,僅是發(fā)布了一篇公眾號(hào)文章。
過(guò)去半年,關(guān)于DeepSeek-V4跳票的傳言、「DeepSeek是否已被超越」的討論、「梁文鋒究竟在做什么」的質(zhì)疑,在中英文AI圈反復(fù)流傳。他們從未回應(yīng),直到這個(gè)周五正式發(fā)布。
先說(shuō)說(shuō)能力表現(xiàn)。官方文章中展示了一張全球頂級(jí)AI大模型的多維度能力對(duì)比圖,從七個(gè)維度將DeepSeek與當(dāng)前最頂尖的三個(gè)大模型高階版本進(jìn)行對(duì)比,這三個(gè)模型分別是Claude Opus 4.6、GPT-5.4和Gemini 3.1 Pro。

這三個(gè)模型是全球閉源模型中的佼佼者,月訂閱費(fèi)用最低20美金,最高達(dá)200美金。而DeepSeek作為開(kāi)源免費(fèi)產(chǎn)品,若與其他開(kāi)源產(chǎn)品或這三家的免費(fèi)版本對(duì)比,本也合理。
但從敢于對(duì)比的勇氣來(lái)看,就值得稱贊。這好比足球界直接將競(jìng)爭(zhēng)對(duì)手鎖定為巴西、阿根廷。
當(dāng)然,成績(jī)也十分亮眼。評(píng)測(cè)涵蓋七個(gè)方面,第一模塊是知識(shí)與推理,第二模塊是智能體能力。就像學(xué)生的七門(mén)學(xué)科,DeepSeek取得了2個(gè)第一、3個(gè)第二、1個(gè)第三和1個(gè)第四。
作為中國(guó)的免費(fèi)開(kāi)源模型,這樣的成績(jī)已相當(dāng)出色,能與頂級(jí)高手不相上下。官方發(fā)布的公眾號(hào)文章,沒(méi)有太多官話套話,全是技術(shù)參數(shù)和調(diào)用方法。
不過(guò),官方文章結(jié)尾引用的荀子名言吸引了我:
?
不誘于譽(yù),不恐于誹,率道而行,端然正己。
這句話的意思是,君子不應(yīng)被贊譽(yù)誘惑,不被誹謗嚇倒,堅(jiān)持自己認(rèn)定的道路,端正自身。這是戰(zhàn)國(guó)時(shí)期荀子在《非十二子》中提出的,后來(lái)成為君子人格的標(biāo)準(zhǔn)定義,主張向內(nèi)追求。
說(shuō)實(shí)話,若放在其他公司身上,我會(huì)覺(jué)得有些刻意。但用在DeepSeek上,卻覺(jué)得很貼切。
接下來(lái),這個(gè)模型是否真的強(qiáng)大,還會(huì)有更多評(píng)測(cè)。大模型的競(jìng)爭(zhēng)是長(zhǎng)期的,了解背后的故事比關(guān)注簡(jiǎn)單參數(shù)更有意義。
今天,我想帶大家看看這次發(fā)布背后真正重要的六件事。
01 遲到15個(gè)月,是另一場(chǎng)硬仗
很多人認(rèn)為DeepSeek-V4跳票是因?yàn)檠邪l(fā)遇瓶頸,模型做不出來(lái)。事實(shí)并非如此。
V4延遲發(fā)布的真正原因,是DeepSeek做出了一個(gè)艱難決定:將整個(gè)底層架構(gòu)從英偉達(dá)的CUDA生態(tài)遷移到華為的昇騰芯片上。
全球絕大多數(shù)AI模型的訓(xùn)練都依賴英偉達(dá)芯片,而CUDA是其配套的開(kāi)發(fā)環(huán)境,如同專用操作系統(tǒng)。過(guò)去十幾年,整個(gè)AI行業(yè)在這套系統(tǒng)上積累了大量代碼、工具和生態(tài),形成了難以繞開(kāi)的護(hù)城河。
這才是英偉達(dá)真正的壁壘,不只是芯片本身。
DeepSeek決定繞開(kāi)它,并非易事。據(jù)業(yè)內(nèi)人士透露,2025年年中,DeepSeek在使用華為昇騰芯片訓(xùn)練V4時(shí),遭遇了訓(xùn)練中途崩潰、穩(wěn)定性不足、芯片間通信速度未達(dá)預(yù)期等一系列問(wèn)題。
他們沒(méi)有放棄,不斷優(yōu)化。最終結(jié)果是:DeepSeek-V4在華為昇騰950PR上的推理速度,較遷移初期提升了35倍。
英偉達(dá)CEO黃仁勛在一檔播客中表示,如果DeepSeek在華為芯片上首發(fā),對(duì)美國(guó)而言將是“a horrible outcome”(可怕的結(jié)果)。能讓經(jīng)歷過(guò)大風(fēng)大浪的黃仁勛說(shuō)出這樣的話,足見(jiàn)這次遷移的重要性。
如今,DeepSeek已實(shí)現(xiàn)這一突破。對(duì)黃仁勛和英偉達(dá)來(lái)說(shuō),他們擔(dān)心的并非某款芯片的銷(xiāo)量,畢竟這在英偉達(dá)的AI基建帝國(guó)中占比不高。
但這一突破的關(guān)鍵價(jià)值在于,“開(kāi)源模型必須以英偉達(dá)芯片為基建”的行業(yè)鐵律被打破了。我認(rèn)為這就是V4遲到15個(gè)月的最大原因。
02 那次“沒(méi)什么亮點(diǎn)”的更新,是地基
如果你一直在使用DeepSeek或關(guān)注其進(jìn)展,可能記得2025年下半年的DeepSeek-V3.2-Exp更新。當(dāng)時(shí)外界反應(yīng)冷淡,跑分與上一版本幾乎無(wú)變化,很多人覺(jué)得DeepSeek在原地踏步。
但那次更新悄悄引入了DSA(DeepSeek Sparse Attention,稀疏注意力機(jī)制)。當(dāng)時(shí)無(wú)人特別關(guān)注,因?yàn)榧夹g(shù)細(xì)節(jié)枯燥,跑分也無(wú)顯著提升,只有少數(shù)技術(shù)文章提及。
而這次DeepSeek-V4官方公告中提到的“全新注意力機(jī)制、在token維度壓縮、大幅降低計(jì)算和顯存需求”,DSA正是核心組成部分。也就是說(shuō),那次被忽視的更新,其實(shí)是V4的基礎(chǔ)工程。
你看,很多重要?jiǎng)幼髟诎l(fā)生時(shí)并不顯眼。我們?nèi)菀锥⒅芊职駟谓箲],卻沒(méi)注意到人家在打基礎(chǔ)。
03 百萬(wàn)上下文,從“頂級(jí)配置”變“水電煤”
此前,量產(chǎn)可用的百萬(wàn)token上下文還是谷歌Gemini的獨(dú)家優(yōu)勢(shì)。其他主流模型大多支持12萬(wàn)到20萬(wàn)token。
DeepSeek這次直接宣布:從即日起,百萬(wàn)上下文是所有官方服務(wù)的標(biāo)配。不是只有旗艦版才有,而是所有版本都具備,且開(kāi)源。
一百萬(wàn)token是什么概念?《三體》三部曲約百萬(wàn)字,你可以將整套書(shū)輸入,詢問(wèn)任何問(wèn)題?;蛘?,把幾百頁(yè)的合同、財(cái)務(wù)報(bào)告、法律文件傳進(jìn)去,讓它幫忙找關(guān)鍵條款、總結(jié)核心內(nèi)容。以前需要幾小時(shí),現(xiàn)在只需幾秒。
更重要的是,這背后有一個(gè)規(guī)律:AI行業(yè)每隔一段時(shí)間,就會(huì)有一項(xiàng)“只有頂級(jí)產(chǎn)品才有的能力”,突然成為人人可用的標(biāo)配。
兩年前是聯(lián)網(wǎng)搜索,一年前是圖片理解,現(xiàn)在是百萬(wàn)上下文?,F(xiàn)在頂級(jí)模型的付費(fèi)功能,到明年普通人大概率都能用上。
04 寫(xiě)代碼,已躋身世界第一梯隊(duì)
官方文章提到:目前DeepSeek-V4已成為公司內(nèi)部員工使用的Agentic Coding模型,使用體驗(yàn)優(yōu)于Claude Sonnet 4.5,交付質(zhì)量接近Claude Opus 4.6非思考模式。
別小看“接近”這個(gè)詞,因?yàn)镃laude在寫(xiě)代碼方面一直遙遙領(lǐng)先,連谷歌和OpenAI內(nèi)部都有人偷偷用它寫(xiě)代碼。所以DeepSeek能接近行業(yè)頂級(jí)水平,本身就是一大進(jìn)步。
第三方數(shù)據(jù)也能印證這一點(diǎn)。在競(jìng)技編程測(cè)評(píng)Codeforces上,DeepSeek-V4得分超過(guò)GPT-5.4;在軟件工程測(cè)試SWE-Verified上,與Claude Opus 4.6幾乎持平。
這兩項(xiàng)測(cè)評(píng)是業(yè)內(nèi)公認(rèn)最能反映模型真實(shí)代碼能力的標(biāo)準(zhǔn)之一。
這對(duì)普通人有什么意義?我認(rèn)為有三個(gè)實(shí)用場(chǎng)景:
做小工具
最直接的應(yīng)用。比如自動(dòng)整理Excel、定時(shí)發(fā)郵件、制作簡(jiǎn)單個(gè)人主頁(yè)。以前要么自己學(xué)編程,要么花錢(qián)找人寫(xiě)?,F(xiàn)在你可以直接發(fā)指令,讓DeepSeek嘗試編寫(xiě)。
不過(guò)別指望一次就滿意,多半要反復(fù)修改,但這個(gè)過(guò)程能讓你了解它的能力邊界。
解決報(bào)錯(cuò)
很多人遇到代碼報(bào)錯(cuò)就慌。其實(shí)報(bào)錯(cuò)說(shuō)明問(wèn)題可解決。把報(bào)錯(cuò)信息復(fù)制進(jìn)去,AI會(huì)告訴你哪里出錯(cuò)、如何修改,無(wú)需懂代碼邏輯。
開(kāi)發(fā)者直接替換
如果你是開(kāi)發(fā)者,市面上主流Agent工具如Claude Code、OpenClaw、OpenCode、CodeBuddy等,DeepSeek-V4都做了專項(xiàng)適配和優(yōu)化,可直接替換使用。
05 為何免費(fèi)?靠什么生存?
結(jié)論是:普通用戶在網(wǎng)頁(yè)端或App端日常使用完全免費(fèi),且短期內(nèi)大概率繼續(xù)免費(fèi)。
原因在于DeepSeek背后的“金主”幻方量化,是中國(guó)頭部量化對(duì)沖基金之一,提供了充足的資金和算力支持。對(duì)現(xiàn)在的DeepSeek來(lái)說(shuō),讓更多人使用、做大生態(tài),比向普通用戶收月租更重要。
真正的盈利方式是B端,向需要大規(guī)模調(diào)用AI的企業(yè)收取API費(fèi)用。例如,各類軟件企業(yè)要將AI能力嵌入產(chǎn)品,需付費(fèi)調(diào)用DeepSeek的商用接口。據(jù)了解,DeepSeek-V4-Pro的調(diào)用成本約為Claude Opus 4.6的七分之一、GPT-5.4的四分之一。
對(duì)企業(yè)而言,用幾分之一的價(jià)格獲得接近頂級(jí)的性能,這筆賬很劃算。不過(guò)由于版本剛發(fā)布,我們Get筆記尚未使用,等完成場(chǎng)景實(shí)測(cè)后會(huì)再分享信息。
06 DeepSeek開(kāi)始大量招聘文科生
這個(gè)細(xì)節(jié)是我在資料中發(fā)現(xiàn)的,很有意思。
過(guò)去一年,北大學(xué)生發(fā)現(xiàn)DeepSeek的HR頻繁出現(xiàn)在中文系宿舍樓,專門(mén)招聘中文系學(xué)生,用于人文領(lǐng)域的數(shù)據(jù)標(biāo)注。
簡(jiǎn)單說(shuō),就是給AI提供“正確答案”。比如讓AI讀古詩(shī),判斷情緒是悲傷還是曠達(dá);看散文,分辨哪些表達(dá)有文采、哪些平淡。這些判斷機(jī)器無(wú)法完成,需要懂文學(xué)、有語(yǔ)感的人來(lái)做。
DeepSeek以前是出了名的“理科做題機(jī)器”,數(shù)學(xué)、代碼、邏輯推理都很強(qiáng);但涉及情感表達(dá)、有溫度的文字時(shí),總差一點(diǎn)?,F(xiàn)在它開(kāi)始彌補(bǔ)這塊短板。
這背后有個(gè)更大的信號(hào):AI競(jìng)爭(zhēng)正從“誰(shuí)更聰明”轉(zhuǎn)向“誰(shuí)更像人”。
推理、數(shù)學(xué)、代碼能力可通過(guò)算力和數(shù)據(jù)堆砌,各家差距逐漸縮小。但情商、語(yǔ)言質(zhì)感、對(duì)人類情感的理解,更難復(fù)制和追趕。
而且招聘中文系學(xué)生,說(shuō)明DeepSeek仍扎根國(guó)內(nèi)市場(chǎng),后續(xù)在中文深度理解、本土化創(chuàng)作等方面的表現(xiàn)值得期待。
最后,回到荀子的那句話
過(guò)去半年,DeepSeek不僅面臨外部質(zhì)疑,內(nèi)部也不平靜:R1核心作者被字節(jié)挖走,LLM核心作者被騰訊挖走,V2核心作者被小米以千萬(wàn)年薪挖走。同時(shí),公司核心員工期權(quán)未市場(chǎng)化定價(jià),留人越來(lái)越難。
可見(jiàn),他們并非一帆風(fēng)順。有技術(shù)攻堅(jiān)的煎熬,有人才流失的壓力,有外界“是不是涼了”的質(zhì)疑,還有長(zhǎng)期未回應(yīng)的輿論真空。
然后在這個(gè)周五,他們默默推出了最新的V4模型。不是“因?yàn)閰柡λ缘ā?,而是“選擇先做,再說(shuō)話”。
說(shuō)實(shí)話,這種風(fēng)格在如今的AI圈很罕見(jiàn)。大多數(shù)公司的發(fā)布節(jié)奏是:先開(kāi)發(fā)布會(huì)造勢(shì),再講故事融資,然后慢慢交付產(chǎn)品。DeepSeek則相反,先做出產(chǎn)品,開(kāi)源、上線,再發(fā)布公告,僅此而已。
我不知道DeepSeek最終會(huì)走向何方。它還面臨很多問(wèn)題:世界知識(shí)儲(chǔ)備仍遜于Gemini,超長(zhǎng)文本細(xì)粒度檢索并非最強(qiáng),核心人才流失后能否保持“不急不躁”的研發(fā)文化也是未知數(shù)。
但至少到今天,它做到了荀子所說(shuō)的那句話。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com



