欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

黃仁勛最擔(dān)心的事發(fā)生了

大廠動(dòng)態(tài)
2分鐘前

“不誘于譽(yù),不恐于誹,率道而行,端然正己?!睅е@十六字理念,4月24日,DeepSeek V4預(yù)覽版正式發(fā)布。距離上一版V3.2更新,已經(jīng)過去了近五個(gè)月。

 

黃仁勛最擔(dān)心的事發(fā)生了!DeepSeek V4華為芯片首發(fā):英偉達(dá)CUDA護(hù)城河崩塌

黃仁勛最擔(dān)心的事發(fā)生了!DeepSeek V4華為芯片首發(fā):英偉達(dá)CUDA護(hù)城河崩塌

當(dāng)下海外主流大模型,基本保持三個(gè)月一輪的快速迭代。相比之下,DeepSeek的節(jié)奏看似偏慢,甚至一度被外界質(zhì)疑掉隊(duì)。

 

黃仁勛最擔(dān)心的事發(fā)生了!DeepSeek V4華為芯片首發(fā):英偉達(dá)CUDA護(hù)城河崩塌

黃仁勛最擔(dān)心的事發(fā)生了!DeepSeek V4華為芯片首發(fā):英偉達(dá)CUDA護(hù)城河崩塌
GPT Image-2生成

就在前幾天,GPT Image-2的出現(xiàn)讓網(wǎng)友驚呼“有圖有真相”的時(shí)代已經(jīng)過去,現(xiàn)在的AI生圖能力,足以以假亂真了。

 

但DeepSeek一邊沉默應(yīng)對外界和對手的質(zhì)疑,另一邊則潛心修煉。

 

黃仁勛最擔(dān)心的事發(fā)生了!DeepSeek V4華為芯片首發(fā):英偉達(dá)CUDA護(hù)城河崩塌

他們說:“感謝每一位用戶的信任與支持,大家的肯定、建議和期許,是我們不竭探索、持續(xù)進(jìn)步的動(dòng)力,也讓我們始終堅(jiān)守初心,專注于不懈的創(chuàng)新。我們將始終秉持長期主義的原則理念,在嘗試與思考中踏實(shí)前行,努力向?qū)崿F(xiàn)AGI的目標(biāo)不斷靠近?!?/strong>

 

事實(shí)證明,長久的蟄伏沉淀與技術(shù)投入,從來都不會(huì)白費(fèi)。

 

今年2月,路透社稱,據(jù)知情人士透露,DeepSeek發(fā)布V4之前,沒有向美國芯片公司NVIDIA和AMD提供模型早期訪問權(quán)限,而是率先讓中國企業(yè)華為提前數(shù)周開展軟件適配優(yōu)化工作?!癰reaking from standard industry practice(打破行業(yè)慣例)?!?/strong>報(bào)道中如此形容這一事件。

 

畢竟,這是此前無論中國公司還是外國公司的大模型,都沒有采用過的方式。

 

實(shí)際上,DeepSeekV4深度適配華為昇騰國產(chǎn)芯片,并非臨時(shí)之舉,而是早有布局。

 

去年8月,DeepSeek發(fā)布DeepSeek-V3.1時(shí),其中一個(gè)重大的進(jìn)步和驚喜,就是支持了UE8M0 FP8 Scale參數(shù)精度,并特別表示這一數(shù)據(jù)格式是針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計(jì)。

 

黃仁勛最擔(dān)心的事發(fā)生了!DeepSeek V4華為芯片首發(fā):英偉達(dá)CUDA護(hù)城河崩塌

 

 

 

黃仁勛最擔(dān)心的事發(fā)生了!DeepSeek V4華為芯片首發(fā):英偉達(dá)CUDA護(hù)城河崩塌

東莞證券指出,該格式通過更高的靈活度支持復(fù)雜模型推理,提升芯片的解碼效率與運(yùn)算能力,為國產(chǎn)芯片適配更大模型提供技術(shù)路徑,國產(chǎn)AI算力生態(tài)有望加速成型。

 

那UE8M0 FP8到底是什么?將有何影響?

 

人工智能領(lǐng)域的企業(yè)家與技術(shù)專家、清華大學(xué)計(jì)算機(jī)系人工智能所博士梁斌表示,DeepSeek為什么非要強(qiáng)調(diào)UE8M0 FP8呢?這個(gè)和NVIDIA的FP8是兩個(gè)東西,兩套標(biāo)準(zhǔn)。

 

他解釋稱,顯存的發(fā)展是有限的,而模型的發(fā)展是快速的,對每個(gè)參數(shù)的表達(dá)必須通過量化進(jìn)行壓縮,FP32就是32位表達(dá)一個(gè)參數(shù),F(xiàn)P8就是8位表達(dá)一個(gè)參數(shù),在可接受的范圍內(nèi),肯定是越低的表達(dá),在顯存里面能裝下更多的參數(shù)。

 

FP8有NVIDIA的E4M3/E5M2方案和DS的這個(gè)UE8M0方案,主要區(qū)別就是前者有3-2位的小數(shù)表達(dá),后者沒有小數(shù)表達(dá)。前者精度好,后者功耗低,運(yùn)算快,對芯片要求低。

 

梁斌表示,現(xiàn)在DeepSeek支持UE8M0 FP8,加上國產(chǎn)芯片都向這個(gè)標(biāo)準(zhǔn)靠攏,這是徹底和NVIDIA決裂了,以后其他推理模型,要么選擇DS這套體系,要么選擇NVIDIA體系,國內(nèi)芯片公司也積極向這套體系靠攏。

 

現(xiàn)在華為他們那邊真是為了適配這個(gè)標(biāo)準(zhǔn),真是玩命干,干成了就是名垂千古,多大誘惑,而且我發(fā)現(xiàn)DeepSeek還真是有膽量,真是把國產(chǎn)大模型的發(fā)展推到了一個(gè)牛X的高度上去,太了不起了?!?/strong>

 

黃仁勛最擔(dān)心的事發(fā)生了!DeepSeek V4華為芯片首發(fā):英偉達(dá)CUDA護(hù)城河崩塌

軟件主動(dòng)適配硬件特性,本質(zhì)上是在為國產(chǎn)芯片提前量體裁衣。

 

主動(dòng)從軟件層面適配國產(chǎn)硬件,提前為本土算力生態(tài)適配鋪路,看似簡單,實(shí)則難度極大。這需要大規(guī)模重寫底層調(diào)度代碼,全方位打通軟硬件兼容鏈路,工程量巨大,技術(shù)壁壘極高。

黃仁勛最擔(dān)心的事發(fā)生了!DeepSeek V4華為芯片首發(fā):英偉達(dá)CUDA護(hù)城河崩塌

長期以來,NVIDIA依靠CUDA生態(tài),將硬件、軟件、開發(fā)者深度綁定,構(gòu)筑起堅(jiān)固的技術(shù)護(hù)城河。巔峰時(shí)期,NVIDIA芯片在國內(nèi)大模型訓(xùn)練市場占比高達(dá)95%,幾乎所有頂級大模型,都高度依賴CUDA框架運(yùn)行。

 

擺在國產(chǎn)AI芯片面前的,一直是兩道艱難選擇題:要么妥協(xié)兼容CUDA,依附海外生態(tài)降低遷移成本;要么自研全套軟件棧,從零搭建自主技術(shù)體系。

 

回看國內(nèi)高端制造、核心科技的發(fā)展歷程就能明白,核心技術(shù)永遠(yuǎn)買不來、討不來,想要不被國外卡脖子,AI領(lǐng)域必須打造軟硬件一體化的自主協(xié)同能力。

 

此次DeepSeek V4完成昇騰深度適配,實(shí)現(xiàn)高吞吐、低時(shí)延的穩(wěn)定推理部署,既是一次關(guān)鍵技術(shù)突破,更是國產(chǎn)AI打破外部技術(shù)壟斷、自主突圍的重要信號。

 

國產(chǎn)算力生態(tài)的崛起,從來不是單點(diǎn)突破。今年初,智譜GLM-5已完成7家主流國產(chǎn)芯片適配,可在純國產(chǎn)算力集群穩(wěn)定運(yùn)行。越來越多大模型,實(shí)現(xiàn)了全流程國產(chǎn)化訓(xùn)練落地,純本土算力的實(shí)踐案例越來越多。

 

業(yè)內(nèi)分析認(rèn)為,這意味著一套完整、成熟的國產(chǎn)AI軟硬件協(xié)同生態(tài),正在穩(wěn)步成型。

 

必須承認(rèn),目前國內(nèi)芯片制程仍有差距,單卡硬件性能不及海外頂尖水平。但這么多年,我們在無數(shù)領(lǐng)域都是如此。

 

從關(guān)鍵設(shè)備、核心軟件被封鎖限制,到一步步自主攻堅(jiān)、慢慢突圍,中國產(chǎn)業(yè)向來擅長在有限條件下,靠架構(gòu)優(yōu)化、集群設(shè)計(jì)、軟硬件協(xié)同、資源統(tǒng)籌,走出屬于自己的發(fā)展道路。

 

這正是我們多年對抗技術(shù)封鎖、突破層層壁壘的縮影,核心技術(shù)自主可控,才能徹底攥緊主動(dòng)權(quán),別人就再也卡不住我們的脖子。

黃仁勛最擔(dān)心的事發(fā)生了!DeepSeek V4華為芯片首發(fā):英偉達(dá)CUDA護(hù)城河崩塌

就在近期,NVIDIA CEO黃仁勛在專訪中直白警告,一旦DeepSeek新一代模型率先登陸華為芯片平臺(tái),對美國科技體系而言,會(huì)是災(zāi)難性結(jié)果。

 

黃仁勛直言,DeepSeek落地華為架構(gòu)、完成專屬優(yōu)化,代表頂級AI模型,可以脫離美國技術(shù)框架實(shí)現(xiàn)高效運(yùn)行,會(huì)直接動(dòng)搖美國在全球AI賽道的競爭優(yōu)勢,造成巨大戰(zhàn)略損失。

 

有意思的是,黃仁勛此前一直反對刻意孤立、圍堵中國科技。他坦言,中國坐擁充足能源、完整芯片產(chǎn)業(yè)鏈和海量AI科研人才,強(qiáng)行將中國推向?qū)α⒚?,人為割裂產(chǎn)業(yè)合作,并不是明智選擇。

 

在他看來,強(qiáng)行拆分兩套AI生態(tài)十分愚蠢。一套是脫離美系技術(shù)的開源本土生態(tài),一套是高度綁定美國架構(gòu)的封閉生態(tài),這種割裂格局,最終只會(huì)反噬美國自身。

 

他也多次提到,中國擁有海量算力資源,只要完成內(nèi)部算力整合,完全可以自給自足,支撐本土AI產(chǎn)業(yè)長期發(fā)展。

 

同時(shí),黃仁勛直言,美國極端的芯片出口管制政策過于短視。結(jié)合他提出的AI“五層蛋糕”理論,能源才是AI最底層的核心根基,7nm成熟制程,完全能夠滿足絕大多數(shù)AI落地需求,而能源充沛,正是中國的天然優(yōu)勢。

 

美國本土能源資源緊張,所以NVIDIA只能拼命壓縮功耗、打磨單卡能效。反觀中國,電力資源儲(chǔ)備充足,不需要極致?lián)该客咝阅?,哪怕用成熟制程芯片,依靠大?guī)模集群組網(wǎng),照樣能補(bǔ)齊硬件差距。

 

即便面臨EUV光刻機(jī)限制,國內(nèi)依舊保有充足的7nm芯片量產(chǎn)能力。全球主流大模型大多基于NVIDIA Hopper架構(gòu)訓(xùn)練,但中國完全可以依托能源優(yōu)勢,用集群規(guī)模抵消單芯片性能短板,走出差異化路線。

 

“他們龐大的AI研究人員隊(duì)伍難道不是他們最根本的優(yōu)勢嗎? 我們都看到了這一點(diǎn)”。這是黃仁勛反復(fù)強(qiáng)調(diào)的一點(diǎn)。受限的硬件環(huán)境,反而倒逼國內(nèi)團(tuán)隊(duì)打磨出更精簡、高效的算法模型。

 

在他眼中,AI行業(yè)的核心突破,更多來自算法迭代,而非單純硬件堆砌。海量本土科研人員、持續(xù)進(jìn)化的自研算法,才是中國AI長期競爭的最大底氣。

本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com