欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

黃仁勛的戰(zhàn)略布局與DeepSeek的生態(tài)擔(dān)當(dāng)

03-14 06:12

本文來自微信公眾號: 未盡研究 ,作者:未盡研究



英偉達(dá)推出了一款近乎完全透明的開源模型,將權(quán)重、數(shù)據(jù)集及訓(xùn)練方案悉數(shù)公開。而以DeepSeek為代表的中國開源模型,目前僅開放了模型權(quán)重。



2026年GTC大會(huì)將于下周一召開,繼去年12月發(fā)布開源模型Nemotron 3 Nano(簡稱Nano)后,英偉達(dá)又推出了開源模型Nemotron 3 Super(簡稱Super),其開放性已然超越了DeepSeek。



黃仁勛此次可謂全力以赴。本周他還罕見地發(fā)布了一篇內(nèi)部博文《AI是個(gè)五層蛋糕》,將AI產(chǎn)業(yè)劃分為能源、芯片、基礎(chǔ)設(shè)施、模型、應(yīng)用五個(gè)層級。



他特意強(qiáng)調(diào)了開源模型的重要性:“全球多數(shù)模型都是免費(fèi)的。研究人員、初創(chuàng)企業(yè)、各類企業(yè)乃至國家,都依賴開源模型參與先進(jìn)人工智能項(xiàng)目。當(dāng)開源模型達(dá)到技術(shù)前沿時(shí),它們不僅會(huì)改變軟件領(lǐng)域,還會(huì)激活整個(gè)技術(shù)棧的需求?!?/p>



他還以DeepSeek-R1為例:“該模型通過廣泛應(yīng)用強(qiáng)大的推理能力,加速了應(yīng)用層的普及,同時(shí)增加了底層訓(xùn)練、基礎(chǔ)設(shè)施、芯片及能源的需求。”目前,DeepSeek在中國正扮演著“激活整個(gè)技術(shù)?!钡慕巧沃囟肋h(yuǎn)。



Nemotron 3系列的Super以及后續(xù)的Ultra,承載著黃仁勛的期望。Super總參數(shù)量達(dá)1200億,在MOE架構(gòu)下活躍參數(shù)為120億。英偉達(dá)表示,它能在軟件開發(fā)、安全故障排查等多智能體應(yīng)用領(lǐng)域,實(shí)現(xiàn)效率與準(zhǔn)確性的最大化。



Super支持百萬token上下文,可助力智能體實(shí)現(xiàn)長期記憶,達(dá)成對齊與高精度推理。英偉達(dá)稱,Super并非Nano的簡單放大版,它引入了架構(gòu)創(chuàng)新,能平衡高參數(shù)推理模型中常見的效率與準(zhǔn)確性矛盾。



混合Mamba-Transformer主干網(wǎng)將Mamba層與Transformer層相結(jié)合,提升了序列處理效率并實(shí)現(xiàn)精確推理,使吞吐量、內(nèi)存及計(jì)算效率均提高4倍。



Super在預(yù)訓(xùn)練階段的大部分浮點(diǎn)乘加運(yùn)算采用了英偉達(dá)的4位浮點(diǎn)格式NVFP4。該格式針對Blackwell架構(gòu)優(yōu)化,與FP8相比,在保持精度的同時(shí),大幅降低了內(nèi)存需求并加快了推理速度。



Super在多項(xiàng)智能體基準(zhǔn)測試中準(zhǔn)確率領(lǐng)先,吞吐量更是表現(xiàn)突出。





英偉達(dá)公布了Super的訓(xùn)練數(shù)據(jù)集:預(yù)訓(xùn)練包含10萬億整理token,額外加入100億推理token及1500萬道編程題;后訓(xùn)練數(shù)據(jù)集有4000萬條新的監(jiān)督與對齊樣本,覆蓋推理、指令遵循、編程、安全及多步驟智能體任務(wù),用于監(jiān)督微調(diào)、偏好數(shù)據(jù)及強(qiáng)化學(xué)習(xí)軌跡,其中約700萬條直接用于SFT(監(jiān)督微調(diào))。



英偉達(dá)還公開了強(qiáng)化學(xué)習(xí)任務(wù)與環(huán)境:在21種環(huán)境配置和37個(gè)數(shù)據(jù)集上進(jìn)行交互式強(qiáng)化學(xué)習(xí)訓(xùn)練(約10個(gè)數(shù)據(jù)集將發(fā)布),包括類軟件工程師智能體訓(xùn)練任務(wù)及帶工具增強(qiáng)的搜索與規(guī)劃任務(wù)。這將訓(xùn)練從靜態(tài)文本擴(kuò)展到動(dòng)態(tài)、可驗(yàn)證的執(zhí)行工作流,訓(xùn)練過程中共生成約120萬條環(huán)境rollout。



英偉達(dá)發(fā)布了Nemotron 3 Super從預(yù)訓(xùn)練到對齊的完整訓(xùn)練與評估方案,開發(fā)者可據(jù)此復(fù)現(xiàn)訓(xùn)練過程、針對特定領(lǐng)域調(diào)整方案,或作為自身混合架構(gòu)研究的起點(diǎn)。



開源模型可分為權(quán)重開放、數(shù)據(jù)透明、訓(xùn)練流程開放三類。通常而言,公布訓(xùn)練數(shù)據(jù)意味著在研究可復(fù)現(xiàn)性上達(dá)到了更高的開源水平。



開放權(quán)重即直接發(fā)布模型權(quán)重,任何人都可下載運(yùn)行,但訓(xùn)練數(shù)據(jù)與流程往往不公開。中國開源模型企業(yè)采取生態(tài)擴(kuò)張優(yōu)先策略,開放權(quán)重能讓企業(yè)部署、開發(fā)者微調(diào)及本地推理,快速形成應(yīng)用生態(tài);在與閉源API競爭時(shí),開放權(quán)重可幫助企業(yè)客戶實(shí)現(xiàn)本地部署、成本優(yōu)勢與自主可控。



提高數(shù)據(jù)透明度涉及版權(quán)、網(wǎng)絡(luò)抓取、合作數(shù)據(jù)等問題,公開這些數(shù)據(jù)需規(guī)避法律與商業(yè)風(fēng)險(xiǎn)。



對比Nemotron與中國的DeepSeek等模型:





Nemotron是真正意義上的開源模型,它不僅是一個(gè)模型,更是一套“開源模型開發(fā)平臺”。



由此可見,英偉達(dá)推出Nemotron不只是打造一個(gè)模型,更像是在推動(dòng)圍繞GPU計(jì)算體系的AI生態(tài)。



需明確的是:英偉達(dá)的核心商業(yè)模式并非售賣模型,而是算力平臺。其收入主要來自GPU、CUDA軟件棧、網(wǎng)絡(luò)互連及數(shù)據(jù)中心系統(tǒng)。只要全球AI訓(xùn)練與推理規(guī)模持續(xù)擴(kuò)大,就會(huì)帶動(dòng)更多GPU需求。因此,對英偉達(dá)而言,關(guān)鍵并非某個(gè)模型是否領(lǐng)先,而是整個(gè)AI生態(tài)是否繼續(xù)依賴GPU計(jì)算體系。



在黃仁勛的“五層蛋糕”理論中,發(fā)布Nemotron這類開源模型具有多重戰(zhàn)略意義。



首先,將開源作為GPU銷售的強(qiáng)力杠桿,這是核心所在。英偉達(dá)不賣模型,而是芯片與計(jì)算基礎(chǔ)設(shè)施。



Super通過NVIDIA NIM打包,可在工作站到云端等多平臺運(yùn)行,支持vLLM、Google Cloud Vertex AI、Oracle Cloud、CoreWeave等眾多平臺。模型越開放、部署越廣,運(yùn)行模型所需的H100/H200/Blackwell GPU銷量就越高。



其次,以架構(gòu)創(chuàng)新綁定自家硬件。Super是Nemotron 3系列中首個(gè)融合LatentMoE、多token預(yù)測(MTP)層與NVFP4預(yù)訓(xùn)練的模型,其中NVFP4是英偉達(dá)Blackwell架構(gòu)獨(dú)有的數(shù)值格式——原生NVFP4預(yù)訓(xùn)練專為NVIDIA Blackwell優(yōu)化,大幅降低了內(nèi)存需求。



也就是說,盡管模型開源,但在英偉達(dá)GPU(尤其是最新Blackwell)上的性能遠(yuǎn)超其他平臺。開源方案實(shí)際上在全球范圍內(nèi)“傳授”了一套天然向英偉達(dá)硬件傾斜的技術(shù)路線。



最后,以“比DeepSeek更開放”搶占技術(shù)話語權(quán)。英偉達(dá)此時(shí)以高度透明的姿態(tài)進(jìn)入,是向全球開發(fā)者社區(qū)傳遞信號:最領(lǐng)先的模型技術(shù)來自美國、來自英偉達(dá)生態(tài)。



Nemotron 3包含針對現(xiàn)實(shí)世界智能體任務(wù)的多環(huán)境強(qiáng)化學(xué)習(xí),相關(guān)RL環(huán)境與數(shù)據(jù)集對開發(fā)者開放,用于領(lǐng)域定制與可復(fù)現(xiàn)性研究。這種透明度會(huì)快速聚集全球研究者與企業(yè)開發(fā)者,圍繞英偉達(dá)生態(tài)構(gòu)建論文、工具鏈與社區(qū),形成對競爭對手的軟性護(hù)城河。



開源加速了模型的商品化,真正有價(jià)值的變?yōu)榈讓佑?jì)算平臺與系統(tǒng)架構(gòu),而這正是英偉達(dá)最擅長且希望掌控的領(lǐng)域。





這也表明AI產(chǎn)業(yè)正從模型競賽轉(zhuǎn)向平臺競賽。未來的競爭很可能不是誰擁有最強(qiáng)模型,而是誰能構(gòu)建完整、高效、可擴(kuò)展的AI計(jì)算與應(yīng)用生態(tài)系統(tǒng)。



如此看來,僅專注于模型而不涉及應(yīng)用的DeepSeek,其關(guān)鍵或許并非簡單發(fā)布DeepSeek-4——單個(gè)模型在中國也難以擺脫商品化——而是它在中國AI計(jì)算與應(yīng)用生態(tài)中所發(fā)揮的作用。



DeepSeek主動(dòng)適配國產(chǎn)芯片,相當(dāng)于為整條國產(chǎn)算力供應(yīng)鏈提供背書與激活。每一位基于DeepSeek開源版本開發(fā)應(yīng)用的中國開發(fā)者,都會(huì)將算力需求導(dǎo)向國產(chǎn)硬件,這對華為昇騰、海光、寒武紀(jì)、摩爾線程、燧原等企業(yè)而言價(jià)值重大。



DeepSeek-4的推出,確實(shí)需要一定時(shí)間。


本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com