欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

<li id="bb3wb"></li>

黃仁勛的戰(zhàn)略布局與DeepSeek的生態(tài)擔(dān)當(dāng)

03-14 06:12

本文來自微信公眾號：未盡研究，作者：未盡研究

英偉達(dá)推出了一款近乎完全透明的開源模型，將權(quán)重、數(shù)據(jù)集及訓(xùn)練方案悉數(shù)公開。而以DeepSeek為代表的中國開源模型，目前僅開放了模型權(quán)重。

2026年GTC大會(huì)將于下周一召開，繼去年12月發(fā)布開源模型Nemotron 3 Nano（簡稱Nano）后，英偉達(dá)又推出了開源模型Nemotron 3 Super（簡稱Super），其開放性已然超越了DeepSeek。

黃仁勛此次可謂全力以赴。本周他還罕見地發(fā)布了一篇內(nèi)部博文《AI是個(gè)五層蛋糕》，將AI產(chǎn)業(yè)劃分為能源、芯片、基礎(chǔ)設(shè)施、模型、應(yīng)用五個(gè)層級。

他特意強(qiáng)調(diào)了開源模型的重要性：“全球多數(shù)模型都是免費(fèi)的。研究人員、初創(chuàng)企業(yè)、各類企業(yè)乃至國家，都依賴開源模型參與先進(jìn)人工智能項(xiàng)目。當(dāng)開源模型達(dá)到技術(shù)前沿時(shí)，它們不僅會(huì)改變軟件領(lǐng)域，還會(huì)激活整個(gè)技術(shù)棧的需求?！?/p>

他還以DeepSeek-R1為例：“該模型通過廣泛應(yīng)用強(qiáng)大的推理能力，加速了應(yīng)用層的普及，同時(shí)增加了底層訓(xùn)練、基礎(chǔ)設(shè)施、芯片及能源的需求。”目前，DeepSeek在中國正扮演著“激活整個(gè)技術(shù)?！钡慕巧沃囟肋h(yuǎn)。

Nemotron 3系列的Super以及后續(xù)的Ultra，承載著黃仁勛的期望。Super總參數(shù)量達(dá)1200億，在MOE架構(gòu)下活躍參數(shù)為120億。英偉達(dá)表示，它能在軟件開發(fā)、安全故障排查等多智能體應(yīng)用領(lǐng)域，實(shí)現(xiàn)效率與準(zhǔn)確性的最大化。

Super支持百萬token上下文，可助力智能體實(shí)現(xiàn)長期記憶，達(dá)成對齊與高精度推理。英偉達(dá)稱，Super并非Nano的簡單放大版，它引入了架構(gòu)創(chuàng)新，能平衡高參數(shù)推理模型中常見的效率與準(zhǔn)確性矛盾。

混合Mamba-Transformer主干網(wǎng)將Mamba層與Transformer層相結(jié)合，提升了序列處理效率并實(shí)現(xiàn)精確推理，使吞吐量、內(nèi)存及計(jì)算效率均提高4倍。

Super在預(yù)訓(xùn)練階段的大部分浮點(diǎn)乘加運(yùn)算采用了英偉達(dá)的4位浮點(diǎn)格式NVFP4。該格式針對Blackwell架構(gòu)優(yōu)化，與FP8相比，在保持精度的同時(shí)，大幅降低了內(nèi)存需求并加快了推理速度。

Super在多項(xiàng)智能體基準(zhǔn)測試中準(zhǔn)確率領(lǐng)先，吞吐量更是表現(xiàn)突出。

英偉達(dá)公布了Super的訓(xùn)練數(shù)據(jù)集：預(yù)訓(xùn)練包含10萬億整理token，額外加入100億推理token及1500萬道編程題；后訓(xùn)練數(shù)據(jù)集有4000萬條新的監(jiān)督與對齊樣本，覆蓋推理、指令遵循、編程、安全及多步驟智能體任務(wù)，用于監(jiān)督微調(diào)、偏好數(shù)據(jù)及強(qiáng)化學(xué)習(xí)軌跡，其中約700萬條直接用于SFT（監(jiān)督微調(diào)）。

英偉達(dá)還公開了強(qiáng)化學(xué)習(xí)任務(wù)與環(huán)境：在21種環(huán)境配置和37個(gè)數(shù)據(jù)集上進(jìn)行交互式強(qiáng)化學(xué)習(xí)訓(xùn)練（約10個(gè)數(shù)據(jù)集將發(fā)布），包括類軟件工程師智能體訓(xùn)練任務(wù)及帶工具增強(qiáng)的搜索與規(guī)劃任務(wù)。這將訓(xùn)練從靜態(tài)文本擴(kuò)展到動(dòng)態(tài)、可驗(yàn)證的執(zhí)行工作流，訓(xùn)練過程中共生成約120萬條環(huán)境rollout。

英偉達(dá)發(fā)布了Nemotron 3 Super從預(yù)訓(xùn)練到對齊的完整訓(xùn)練與評估方案，開發(fā)者可據(jù)此復(fù)現(xiàn)訓(xùn)練過程、針對特定領(lǐng)域調(diào)整方案，或作為自身混合架構(gòu)研究的起點(diǎn)。

開源模型可分為權(quán)重開放、數(shù)據(jù)透明、訓(xùn)練流程開放三類。通常而言，公布訓(xùn)練數(shù)據(jù)意味著在研究可復(fù)現(xiàn)性上達(dá)到了更高的開源水平。

開放權(quán)重即直接發(fā)布模型權(quán)重，任何人都可下載運(yùn)行，但訓(xùn)練數(shù)據(jù)與流程往往不公開。中國開源模型企業(yè)采取生態(tài)擴(kuò)張優(yōu)先策略，開放權(quán)重能讓企業(yè)部署、開發(fā)者微調(diào)及本地推理，快速形成應(yīng)用生態(tài)；在與閉源API競爭時(shí)，開放權(quán)重可幫助企業(yè)客戶實(shí)現(xiàn)本地部署、成本優(yōu)勢與自主可控。

提高數(shù)據(jù)透明度涉及版權(quán)、網(wǎng)絡(luò)抓取、合作數(shù)據(jù)等問題，公開這些數(shù)據(jù)需規(guī)避法律與商業(yè)風(fēng)險(xiǎn)。

對比Nemotron與中國的DeepSeek等模型：

Nemotron是真正意義上的開源模型，它不僅是一個(gè)模型，更是一套“開源模型開發(fā)平臺”。

由此可見，英偉達(dá)推出Nemotron不只是打造一個(gè)模型，更像是在推動(dòng)圍繞GPU計(jì)算體系的AI生態(tài)。

需明確的是：英偉達(dá)的核心商業(yè)模式并非售賣模型，而是算力平臺。其收入主要來自GPU、CUDA軟件棧、網(wǎng)絡(luò)互連及數(shù)據(jù)中心系統(tǒng)。只要全球AI訓(xùn)練與推理規(guī)模持續(xù)擴(kuò)大，就會(huì)帶動(dòng)更多GPU需求。因此，對英偉達(dá)而言，關(guān)鍵并非某個(gè)模型是否領(lǐng)先，而是整個(gè)AI生態(tài)是否繼續(xù)依賴GPU計(jì)算體系。

在黃仁勛的“五層蛋糕”理論中，發(fā)布Nemotron這類開源模型具有多重戰(zhàn)略意義。

首先，將開源作為GPU銷售的強(qiáng)力杠桿，這是核心所在。英偉達(dá)不賣模型，而是芯片與計(jì)算基礎(chǔ)設(shè)施。

Super通過NVIDIA NIM打包，可在工作站到云端等多平臺運(yùn)行，支持vLLM、Google Cloud Vertex AI、Oracle Cloud、CoreWeave等眾多平臺。模型越開放、部署越廣，運(yùn)行模型所需的H100/H200/Blackwell GPU銷量就越高。

其次，以架構(gòu)創(chuàng)新綁定自家硬件。Super是Nemotron 3系列中首個(gè)融合LatentMoE、多token預(yù)測（MTP）層與NVFP4預(yù)訓(xùn)練的模型，其中NVFP4是英偉達(dá)Blackwell架構(gòu)獨(dú)有的數(shù)值格式——原生NVFP4預(yù)訓(xùn)練專為NVIDIA Blackwell優(yōu)化，大幅降低了內(nèi)存需求。

也就是說，盡管模型開源，但在英偉達(dá)GPU（尤其是最新Blackwell）上的性能遠(yuǎn)超其他平臺。開源方案實(shí)際上在全球范圍內(nèi)“傳授”了一套天然向英偉達(dá)硬件傾斜的技術(shù)路線。

最后，以“比DeepSeek更開放”搶占技術(shù)話語權(quán)。英偉達(dá)此時(shí)以高度透明的姿態(tài)進(jìn)入，是向全球開發(fā)者社區(qū)傳遞信號：最領(lǐng)先的模型技術(shù)來自美國、來自英偉達(dá)生態(tài)。

Nemotron 3包含針對現(xiàn)實(shí)世界智能體任務(wù)的多環(huán)境強(qiáng)化學(xué)習(xí)，相關(guān)RL環(huán)境與數(shù)據(jù)集對開發(fā)者開放，用于領(lǐng)域定制與可復(fù)現(xiàn)性研究。這種透明度會(huì)快速聚集全球研究者與企業(yè)開發(fā)者，圍繞英偉達(dá)生態(tài)構(gòu)建論文、工具鏈與社區(qū)，形成對競爭對手的軟性護(hù)城河。

開源加速了模型的商品化，真正有價(jià)值的變?yōu)榈讓佑?jì)算平臺與系統(tǒng)架構(gòu)，而這正是英偉達(dá)最擅長且希望掌控的領(lǐng)域。

這也表明AI產(chǎn)業(yè)正從模型競賽轉(zhuǎn)向平臺競賽。未來的競爭很可能不是誰擁有最強(qiáng)模型，而是誰能構(gòu)建完整、高效、可擴(kuò)展的AI計(jì)算與應(yīng)用生態(tài)系統(tǒng)。

如此看來，僅專注于模型而不涉及應(yīng)用的DeepSeek，其關(guān)鍵或許并非簡單發(fā)布DeepSeek-4——單個(gè)模型在中國也難以擺脫商品化——而是它在中國AI計(jì)算與應(yīng)用生態(tài)中所發(fā)揮的作用。

DeepSeek主動(dòng)適配國產(chǎn)芯片，相當(dāng)于為整條國產(chǎn)算力供應(yīng)鏈提供背書與激活。每一位基于DeepSeek開源版本開發(fā)應(yīng)用的中國開發(fā)者，都會(huì)將算力需求導(dǎo)向國產(chǎn)硬件，這對華為昇騰、海光、寒武紀(jì)、摩爾線程、燧原等企業(yè)而言價(jià)值重大。

DeepSeek-4的推出，確實(shí)需要一定時(shí)間。

本文僅代表作者觀點(diǎn)，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

青科大工程學(xué)躋身ESI全球前1‰ 學(xué)科建設(shè)再獲突破

雷諾借中國效率縮短新車研發(fā)周期至22個(gè)月，全球汽車產(chǎn)業(yè)雙向流動(dòng)改寫規(guī)則

AWE2026盛大開幕，京東MALL同步首發(fā)，引領(lǐng)科技消費(fèi)新潮流

18元一顆的餃子Omakase？高端化浪潮下，餃子品牌如何破局？

多彩椒江惹人醉，生態(tài)畫卷入眼來（文末有福利）

項(xiàng)目推薦

<ruby id="reaom"></ruby><style id="reaom"><progress id="reaom"><output id="reaom"></output></progress></style>