欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

DeepSeek V4正式發(fā)布:聚焦Agent能力,訓(xùn)練硬件成謎

04-25 06:42

備受矚目的DeepSeek V4預(yù)覽版于北京時(shí)間4月24日上午正式發(fā)布。此前,媒體與分析師曾多次預(yù)測(cè)其發(fā)布時(shí)間卻均未成功,此次終于塵埃落定。由于發(fā)布時(shí)間尚短,第三方及客戶評(píng)測(cè)仍在進(jìn)行,目前有效信息有限,但通過技術(shù)文檔與海外AI社區(qū)的初步討論,我們?nèi)阅塬@取一些關(guān)鍵信息。


首先,V4的核心戰(zhàn)略方向是提升Agent能力,這與OpenClaw推出后引發(fā)的行業(yè)趨勢(shì)高度契合。“全民養(yǎng)龍蝦”的熱潮為MiniMax、Kimi、智譜等國產(chǎn)大模型廠商帶來了顯著的Token增量,然而最關(guān)鍵、最專業(yè)的增量卻被Claude收入囊中。Agent能力與編程能力緊密相關(guān),Claude Code至今仍是全球最強(qiáng)大的AI編程工具,GPT-Codex也難以撼動(dòng)其地位。DeepSeek官方公告在開頭便強(qiáng)調(diào)“Agent能力大幅提升”,但同時(shí)也承認(rèn)“(據(jù)評(píng)測(cè)反饋)與Opus 4.6的思考模式仍存在一定差距”。


在海外AI社區(qū),部分用戶對(duì)DeepSeek V4充滿期待,甚至希望它能成為“Claude殺手”——不過客觀而言,這更多是一種美好愿望,畢竟不少人對(duì)Claude及其開發(fā)商Anthropic頗有不滿,“天下苦Anthropic久矣”的說法也反映了這種情緒。從目前的測(cè)試數(shù)據(jù)來看,V4的Token性價(jià)比表現(xiàn)突出,但Agent Benchmark指標(biāo)尚未超越Claude Opus-4.6和GPT-5.4。需要注意的是,Benchmark分?jǐn)?shù)僅具參考意義,實(shí)際用戶體驗(yàn)才是關(guān)鍵。Claude在許多Benchmark測(cè)試中并不優(yōu)于GPT和Gemini,卻在Agent領(lǐng)域幾乎獨(dú)占鰲頭。因此,專業(yè)用戶使用DeepSeek進(jìn)行Agent操作的實(shí)際反饋值得重點(diǎn)關(guān)注。


上下文窗口擴(kuò)展至1M是V4的重要升級(jí),結(jié)合較低的Token定價(jià),有望大幅提升生產(chǎn)力。不過,這仍需等待專業(yè)客戶完成復(fù)雜任務(wù)后的實(shí)際反饋,預(yù)計(jì)還需幾天時(shí)間。


關(guān)于發(fā)布時(shí)間延遲的原因,筆者猜測(cè)可能是為了打磨Agent能力?!褒埼r”熱潮帶來的增量超出預(yù)期,與其發(fā)布一個(gè)無法滿足現(xiàn)實(shí)Agentic Workflow需求的模型,不如多花幾個(gè)月時(shí)間推出一個(gè)完全適配需求的版本。當(dāng)然,這只是個(gè)人猜測(cè),尚無實(shí)證支持。


其次,從最初的海外客戶反饋來看,在執(zhí)行“非深度推理、非數(shù)學(xué)、非代碼”任務(wù)(如頭腦風(fēng)暴、文藝創(chuàng)作)時(shí),V4的回答給人“太干”“過于正式”的感覺,落后于Claude和GPT的最新版本,甚至有人認(rèn)為不如GPT-5.2。需要強(qiáng)調(diào)的是,這些零散的主觀感受并不能代表整體情況,且文藝創(chuàng)作并非V4的主要發(fā)力方向。不過,這可能會(huì)對(duì)消費(fèi)端用戶的選擇產(chǎn)生微妙影響,進(jìn)而干擾當(dāng)前互聯(lián)網(wǎng)大廠在C端AI應(yīng)用市場的競爭格局。


若V4的回答確實(shí)存在“太干”“過于正式”的問題,或許是為解決V3/R1版本幻覺率較高的問題而采取的調(diào)整。自由發(fā)揮往往會(huì)導(dǎo)致幻覺率上升,而限制幻覺率則難免讓回答變得“更干”。當(dāng)然,這也只是猜測(cè),還需更多廣泛的測(cè)試結(jié)果來驗(yàn)證。


第三,也是大家最關(guān)心的一點(diǎn):DeepSeek V4的技術(shù)文件披露了諸多訓(xùn)練細(xì)節(jié),但未提及訓(xùn)練硬件(顯卡)。整份文件中,“華為”僅被提及一次,“英偉達(dá)”被提及三次(不含腳注);“GPU”被提及十四次(不含腳注),但均未說明具體型號(hào),僅在一處提到“我們?cè)贜VIDIA GPU和華為NPU平臺(tái)上驗(yàn)證了細(xì)粒度EP方案”——不過這僅指測(cè)試環(huán)境,并非訓(xùn)練場景(注:這也是唯一一次提到華為昇騰NPU)。


因此,我們?nèi)圆磺宄﨑eepSeek V4究竟是在何種硬件上訓(xùn)練的。技術(shù)文件中雖幾次提到CUDA,但不能據(jù)此斷定完全基于英偉達(dá)架構(gòu)。是否如部分分析師預(yù)期的“基于英偉達(dá)與華為昇騰混合架構(gòu)訓(xùn)練”,或是“在后訓(xùn)練環(huán)節(jié)針對(duì)昇騰進(jìn)行了專門優(yōu)化”?遺憾的是,DeepSeek官方既未認(rèn)可也未否認(rèn)。相比之下,V3的技術(shù)文件在開頭就明確表示是使用英偉達(dá)H800和A100訓(xùn)練的。



圖片由Google Nano Banana Pro制作


有人根據(jù)DeepSeek公告中“預(yù)計(jì)下半年昇騰950超節(jié)點(diǎn)批量上市后,Pro的價(jià)格會(huì)大幅下調(diào)”的表述,得出“V4針對(duì)昇騰做了深度優(yōu)化”甚至“從1月推遲發(fā)布是為了適配昇騰”的結(jié)論。雖然不能完全排除這種可能,但這種推斷過于牽強(qiáng)。這只能說明DeepSeek官方會(huì)采購或租用昇騰算力,并對(duì)昇騰推理進(jìn)行了一些優(yōu)化(這是正常操作),至于優(yōu)化程度深淺、是否因適配昇騰而推遲發(fā)布,目前均無實(shí)證支持。


不過,要間接驗(yàn)證或證偽這一點(diǎn)并不難。V4是開源的,從發(fā)布之日起,會(huì)有眾多廠商用自己的算力進(jìn)行推理測(cè)試。若它確實(shí)基于昇騰訓(xùn)練,或針對(duì)昇騰做了深度優(yōu)化,那么其在昇騰硬件上的推理效率應(yīng)高于或至少與英偉達(dá)等其他硬件相當(dāng),甚至?xí)N騰硬件能讓V4實(shí)現(xiàn)其他硬件無法達(dá)到的獨(dú)特性能。只需關(guān)注相關(guān)新聞即可了解實(shí)際情況(若未看到相關(guān)新聞則可視為證偽)。


最后談?wù)剬?duì)產(chǎn)業(yè)界的影響。除了DeepSeek自身,最期待V4發(fā)布并引發(fā)轟動(dòng)的或許是騰訊。昨日騰訊混元3.0大模型預(yù)覽版剛發(fā)布,其光芒便被今日的DeepSeek V4完全掩蓋。筆者尚未全面試用混元3.0,但考慮到騰訊此前在基座大模型領(lǐng)域的落后程度,僅靠一個(gè)版本就達(dá)到世界先進(jìn)水平似乎不太現(xiàn)實(shí)。


因此,騰訊若想在AI業(yè)務(wù)上有所作為,無論是To B生意(尤其是賣Token的MaaS業(yè)務(wù))還是To C生意,恐怕仍需依賴高質(zhì)量的第三方開源大模型。國內(nèi)水平最高、用戶最多的開源大模型是Qwen,而它屬于騰訊的老對(duì)手阿里,騰訊顯然不愿使用。如此一來,騰訊只能依靠DeepSeek以及幾天前剛發(fā)布新版本的Kimi。若DeepSeek開啟融資,騰訊大概率會(huì)不惜代價(jià)參與投資。V4越成功,騰訊就能爭取到更多時(shí)間——一邊努力將自己打造成“國產(chǎn)開源生態(tài)”的聚合平臺(tái),另一邊全力提升自研大模型的實(shí)力。


筆者認(rèn)為,目前最期待V4在用戶測(cè)試中傳來捷報(bào)的,應(yīng)該是騰訊的投資人和管理層。幸運(yùn)的是,從初期反饋來看,海外社區(qū)的評(píng)價(jià)偏向積極。但這還不夠,我們還需要更多信息,而且僅僅“偏向積極”遠(yuǎn)遠(yuǎn)不夠,最好是“十分積極”——這恐怕還得等上一個(gè)星期才能確認(rèn)。


本文來自微信公眾號(hào)“互聯(lián)網(wǎng)怪盜團(tuán)”(ID:TMTphantom),作者:怪盜團(tuán)團(tuán)長裴培,36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com