欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

DeepSeek大幅降價(jià)

大廠動態(tài)
2天前

DeepSeek大幅降價(jià)背后,與DeepSeek?V4的技術(shù)升級以及和昇騰生態(tài)的深度協(xié)同有關(guān)。

DeepSeek正在重新定義大模型普惠的邊界。

 

4月26日,DeepSeek官方發(fā)布API價(jià)格調(diào)整公告,全系A(chǔ)PI輸入緩存命中價(jià)格降至首發(fā)價(jià)的十分之一,V4?Pro更疊加限時(shí)2.5折,百萬Tokens輸入緩存命中低至0.025元,創(chuàng)全球大模型價(jià)格新低。

 

根據(jù)DeepSeek官方API定價(jià)頁面公示,本次降價(jià)覆蓋V4系列全模型,核心調(diào)整集中在輸入緩存命中場景。其中DeepSeek-V4-Flash輸入緩存命中價(jià)格從0.2元/百萬Tokens降至0.02元/百萬Tokens。

 

面向企業(yè)級用戶的DeepSeek-V4-Pro優(yōu)惠力度更大,原價(jià)1元/百萬Tokens的緩存輸入降至0.1元,2026年5月5日前疊加2.5折限時(shí)特惠,實(shí)際僅0.025元/百萬Tokens,緩存未命中輸入從12元降至3元,輸出從24元降至6元。

 

 

DeepSeek方面提及,DeepSeek-Chat與DeepSeek-Reasoner兩個(gè)模型名將于日后棄用。出于兼容考慮,二者分別對應(yīng)DeepSeek-V4-Flash的非思考與思考模式。

 

對比調(diào)價(jià)前后不難發(fā)現(xiàn),高頻調(diào)用、長文本處理場景成本降幅超90%,RAG知識庫、智能客服、文檔分析等緩存命中率高的應(yīng)用,可直接實(shí)現(xiàn)商用成本斷崖式下跌,有助于打破AI規(guī)?;涞氐某杀炯湘i。

 

DeepSeek大幅降價(jià)背后,與DeepSeek?V4的技術(shù)升級以及和昇騰生態(tài)的深度協(xié)同有關(guān)。

 

4月24日,DeepSeek?V4預(yù)覽版正式發(fā)布,同步開源Pro與Flash兩款模型,均支持100萬token超長上下文,自研稀疏注意力架構(gòu)讓推理算力消耗大幅降低,Pro版單token算力僅為V3.2的27%,KV緩存降至10%,從底層實(shí)現(xiàn)成本優(yōu)化。

 

DeepSeek方面公布的參數(shù)顯示,DeepSeek?V4?Pro激活參數(shù)49B、預(yù)訓(xùn)練數(shù)據(jù)33T,定位高性能旗艦;DeepSeek?V4?Flash激活參數(shù)13B、預(yù)訓(xùn)練數(shù)據(jù)32T,主打高速與低成本。

 

與前代模型比較,DeepSeek-V4-Pro的Agent能力顯著增強(qiáng)。在Agentic Coding評測中,V4-Pro已達(dá)到當(dāng)前開源模型最佳水平,并在其他Agent相關(guān)評測中同樣表現(xiàn)優(yōu)異。據(jù)悉,目前DeepSeek-V4已成為DeepSeek內(nèi)部員工使用的 Agentic Coding模型,據(jù)評測反饋使用體驗(yàn)優(yōu)于Sonnet 4.5,交付質(zhì)量接近Claude Opus 4.6非思考模式,但仍與Opus 4.6思考模式存在一定差距。

 

在世界知識測評中,DeepSeek-V4-Pro大幅領(lǐng)先其他開源模型,稍遜于頂尖閉源模型Gemini-Pro-3.1。而在數(shù)學(xué)、STEM、競賽型代碼的測評中,DeepSeek-V4-Pro超越當(dāng)前所有已公開評測的開源模型,比肩世界頂級閉源模型。

 

相比DeepSeek-V4-Pro,DeepSeek-V4-Flash在世界知識儲備方面稍遜一籌,但展現(xiàn)出了接近的推理能力。而由于模型參數(shù)和激活更小,相較之下V4-Flash能夠提供更加快捷、經(jīng)濟(jì)的API服務(wù)。

 

DeepSeek-V4還開創(chuàng)了一種新的注意力機(jī)制,在token維度進(jìn)行壓縮,結(jié)合DSA稀疏注意力(DeepSeek Sparse Attention),實(shí)現(xiàn)了全球領(lǐng)先的長上下文能力,并且相比于傳統(tǒng)方法大幅降低了對計(jì)算和顯存的需求。

 

更值得關(guān)注的是,昇騰超節(jié)點(diǎn)全系列產(chǎn)品支持DeepSeek V4系列模型。這也意味著,DeepSeek釋放了更多國產(chǎn)化信號。

 

DeepSeek-V4在一份技術(shù)報(bào)告中提及,“在英偉達(dá)GPU和華為昇騰NPU兩個(gè)平臺上驗(yàn)證了細(xì)粒度EP(專家并行)方案,與強(qiáng)力的非融合(non-fused)基線相比,該方案在通用推理任務(wù)中實(shí)現(xiàn)了1.50-1.73倍加速;在對延遲敏感的場景(例如強(qiáng)化學(xué)習(xí)(RL)rollout 和高速 Agent 服務(wù))中,最高可達(dá)1.96倍加速。”

 

DeepSeek強(qiáng)調(diào),隨著下半年昇騰超節(jié)點(diǎn)全系列產(chǎn)品批量上市,Pro版價(jià)格有望大幅下調(diào)。

 

DeepSeek-V4發(fā)布后,高盛發(fā)布分析報(bào)告指出,DeepSeek V4的核心意義在于以更低成本支持更復(fù)雜的智能體應(yīng)用落地,從而打開AI應(yīng)用規(guī)?;男驴臻g。對于納入昇騰超節(jié)點(diǎn),高盛認(rèn)為DeepSeek的成本競爭力將進(jìn)一步強(qiáng)化,為更廣泛的應(yīng)用落地創(chuàng)造條件。此外,在芯片持續(xù)收緊的背景下,中國頂尖AI模型向國產(chǎn)算力遷移的趨勢得到頭部玩家的明確背書。

 

高盛報(bào)告還援引新聞報(bào)道稱,騰訊和阿里正在洽談以逾200億美元估值投資DeepSeek,而智譜和MiniMax的最新市值分別約為530億美元和310億美元,這一潛在交易折射出巨頭對稀缺頂層AI能力的爭奪邏輯。

 

而華泰證券認(rèn)為,市場容易將V4理解為“降本壓低算力、存儲需求”,但更重要的邊際變化在于長上下文成本下降后,復(fù)雜Agent、多文檔分析、長周期任務(wù)、在線學(xué)習(xí)等場景可用性提升,推理調(diào)用量與存儲訪問頻次有望擴(kuò)張。

本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com