欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

DeepSeek大模型API價(jià)格大降 技術(shù)升級(jí)與昇騰生態(tài)協(xié)同成關(guān)鍵

2天前
DeepSeek正重新劃定大模型普惠的邊界。4月26日,DeepSeek官方發(fā)布API價(jià)格調(diào)整公告,全系A(chǔ)PI輸入緩存命中價(jià)格降至首發(fā)價(jià)的十分之一,V4-Pro更疊加限時(shí)2.5折優(yōu)惠,百萬(wàn)Tokens輸入緩存命中低至0.025元,創(chuàng)下全球大模型價(jià)格新低。


依據(jù)DeepSeek官方API定價(jià)頁(yè)面的公示,此次降價(jià)覆蓋V4系列所有模型,核心調(diào)整聚焦在輸入緩存命中場(chǎng)景。其中,DeepSeek-V4-Flash輸入緩存命中價(jià)格從0.2元/百萬(wàn)Tokens降至0.02元/百萬(wàn)Tokens。


面向企業(yè)級(jí)用戶的DeepSeek-V4-Pro優(yōu)惠力度更大,原價(jià)1元/百萬(wàn)Tokens的緩存輸入降至0.1元,在2026年5月5日前疊加2.5折限時(shí)特惠,實(shí)際僅需0.025元/百萬(wàn)Tokens;緩存未命中輸入從12元降至3元,輸出則從24元降至6元。



DeepSeek方面表示,DeepSeek-Chat與DeepSeek-Reasoner兩個(gè)模型名日后將被棄用。出于兼容考慮,二者分別對(duì)應(yīng)DeepSeek-V4-Flash的非思考與思考模式。


對(duì)比調(diào)價(jià)前后可以發(fā)現(xiàn),高頻調(diào)用、長(zhǎng)文本處理場(chǎng)景的成本降幅超過90%。像RAG知識(shí)庫(kù)、智能客服、文檔分析等緩存命中率高的應(yīng)用,能直接實(shí)現(xiàn)商用成本的斷崖式下跌,這有助于打破AI規(guī)?;涞氐某杀鞠拗?。


DeepSeek此次大幅降價(jià),與DeepSeek-V4的技術(shù)升級(jí)以及和昇騰生態(tài)的深度協(xié)同密切相關(guān)。


4月24日,DeepSeek-V4預(yù)覽版正式發(fā)布,同時(shí)開源了Pro與Flash兩款模型,它們都支持100萬(wàn)token的超長(zhǎng)上下文。自研的稀疏注意力架構(gòu)使推理算力消耗大幅降低,Pro版單token算力僅為V3.2的27%,KV緩存降至10%,從底層實(shí)現(xiàn)了成本優(yōu)化。


DeepSeek方面公布的參數(shù)顯示,DeepSeek-V4-Pro激活參數(shù)為49B、預(yù)訓(xùn)練數(shù)據(jù)33T,定位是高性能旗艦;DeepSeek-V4-Flash激活參數(shù)13B、預(yù)訓(xùn)練數(shù)據(jù)32T,主打高速與低成本。


和前代模型相比,DeepSeek-V4-Pro的Agent能力有顯著增強(qiáng)。在Agentic Coding評(píng)測(cè)中,V4-Pro已達(dá)到當(dāng)前開源模型的最佳水平,在其他Agent相關(guān)評(píng)測(cè)中表現(xiàn)也很出色。據(jù)悉,目前DeepSeek-V4已成為DeepSeek內(nèi)部員工使用的Agentic Coding模型,評(píng)測(cè)反饋其使用體驗(yàn)優(yōu)于Sonnet 4.5,交付質(zhì)量接近Claude Opus 4.6非思考模式,但和Opus 4.6思考模式仍有一定差距。


在世界知識(shí)測(cè)評(píng)中,DeepSeek-V4-Pro大幅領(lǐng)先其他開源模型,略遜于頂尖閉源模型Gemini-Pro-3.1。而在數(shù)學(xué)、STEM、競(jìng)賽型代碼的測(cè)評(píng)中,DeepSeek-V4-Pro超越了當(dāng)前所有已公開評(píng)測(cè)的開源模型,可與世界頂級(jí)閉源模型比肩。


與DeepSeek-V4-Pro相比,DeepSeek-V4-Flash在世界知識(shí)儲(chǔ)備方面稍顯遜色,但推理能力與之接近。并且由于模型參數(shù)和激活更小,V4-Flash能提供更快捷、經(jīng)濟(jì)的API服務(wù)。


DeepSeek-V4還開創(chuàng)了一種新的注意力機(jī)制,在token維度進(jìn)行壓縮,結(jié)合DSA稀疏注意力(DeepSeek Sparse Attention),實(shí)現(xiàn)了全球領(lǐng)先的長(zhǎng)上下文能力,且相比傳統(tǒng)方法大幅降低了對(duì)計(jì)算和顯存的需求。


更值得關(guān)注的是,昇騰超節(jié)點(diǎn)全系列產(chǎn)品支持DeepSeek V4系列模型,這也表明DeepSeek釋放出了更多國(guó)產(chǎn)化信號(hào)。


DeepSeek-V4在一份技術(shù)報(bào)告中提到:“在英偉達(dá)GPU和華為昇騰NPU兩個(gè)平臺(tái)上驗(yàn)證了細(xì)粒度EP(專家并行)方案,與強(qiáng)力的非融合(non-fused)基線相比,該方案在通用推理任務(wù)中實(shí)現(xiàn)了1.50 - 1.73倍加速;在對(duì)延遲敏感的場(chǎng)景(如強(qiáng)化學(xué)習(xí)(RL)rollout和高速Agent服務(wù))中,最高可達(dá)1.96倍加速?!?/p>


DeepSeek強(qiáng)調(diào),隨著下半年昇騰超節(jié)點(diǎn)全系列產(chǎn)品批量上市,Pro版價(jià)格有望大幅下調(diào)。


DeepSeek-V4發(fā)布后,高盛發(fā)布分析報(bào)告指出,DeepSeek V4的核心意義在于以更低成本支持更復(fù)雜的智能體應(yīng)用落地,從而打開AI應(yīng)用規(guī)?;男驴臻g。對(duì)于納入昇騰超節(jié)點(diǎn),高盛認(rèn)為DeepSeek的成本競(jìng)爭(zhēng)力將進(jìn)一步強(qiáng)化,為更廣泛的應(yīng)用落地創(chuàng)造條件。此外,在芯片持續(xù)收緊的背景下,中國(guó)頂尖AI模型向國(guó)產(chǎn)算力遷移的趨勢(shì)得到了頭部玩家的明確支持。


高盛報(bào)告還援引新聞報(bào)道稱,騰訊和阿里正在洽談以逾200億美元估值投資DeepSeek,而智譜和MiniMax的最新市值分別約為530億美元和310億美元,這一潛在交易反映出巨頭對(duì)稀缺頂層AI能力的爭(zhēng)奪邏輯。


華泰證券則認(rèn)為,市場(chǎng)容易將V4理解為“降本壓低算力、存儲(chǔ)需求”,但更重要的邊際變化在于長(zhǎng)上下文成本下降后,復(fù)雜Agent、多文檔分析、長(zhǎng)周期任務(wù)、在線學(xué)習(xí)等場(chǎng)景的可用性得到提升,推理調(diào)用量與存儲(chǔ)訪問頻次有望增加。


本文來自微信公眾號(hào)“界面新聞”,作者:宋佳楠,36氪經(jīng)授權(quán)發(fā)布。


本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com