欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

<li id="bb3wb"></li>

<th id="bu8u8"></th>

<blockquote id="bu8u8"><tbody id="bu8u8"></tbody></blockquote>

<small id="bu8u8"></small>

<bdo id="bu8u8"><dl id="bu8u8"></dl></bdo>

DeepSeek大模型API價(jià)格大降技術(shù)升級(jí)與昇騰生態(tài)協(xié)同成關(guān)鍵

2天前

DeepSeek正重新劃定大模型普惠的邊界。4月26日，DeepSeek官方發(fā)布API價(jià)格調(diào)整公告，全系A(chǔ)PI輸入緩存命中價(jià)格降至首發(fā)價(jià)的十分之一，V4-Pro更疊加限時(shí)2.5折優(yōu)惠，百萬(wàn)Tokens輸入緩存命中低至0.025元，創(chuàng)下全球大模型價(jià)格新低。

依據(jù)DeepSeek官方API定價(jià)頁(yè)面的公示，此次降價(jià)覆蓋V4系列所有模型，核心調(diào)整聚焦在輸入緩存命中場(chǎng)景。其中，DeepSeek-V4-Flash輸入緩存命中價(jià)格從0.2元/百萬(wàn)Tokens降至0.02元/百萬(wàn)Tokens。

面向企業(yè)級(jí)用戶的DeepSeek-V4-Pro優(yōu)惠力度更大，原價(jià)1元/百萬(wàn)Tokens的緩存輸入降至0.1元，在2026年5月5日前疊加2.5折限時(shí)特惠，實(shí)際僅需0.025元/百萬(wàn)Tokens；緩存未命中輸入從12元降至3元，輸出則從24元降至6元。

DeepSeek方面表示，DeepSeek-Chat與DeepSeek-Reasoner兩個(gè)模型名日后將被棄用。出于兼容考慮，二者分別對(duì)應(yīng)DeepSeek-V4-Flash的非思考與思考模式。

對(duì)比調(diào)價(jià)前后可以發(fā)現(xiàn)，高頻調(diào)用、長(zhǎng)文本處理場(chǎng)景的成本降幅超過90%。像RAG知識(shí)庫(kù)、智能客服、文檔分析等緩存命中率高的應(yīng)用，能直接實(shí)現(xiàn)商用成本的斷崖式下跌，這有助于打破AI規(guī)?；涞氐某杀鞠拗?。

DeepSeek此次大幅降價(jià)，與DeepSeek-V4的技術(shù)升級(jí)以及和昇騰生態(tài)的深度協(xié)同密切相關(guān)。

4月24日，DeepSeek-V4預(yù)覽版正式發(fā)布，同時(shí)開源了Pro與Flash兩款模型，它們都支持100萬(wàn)token的超長(zhǎng)上下文。自研的稀疏注意力架構(gòu)使推理算力消耗大幅降低，Pro版單token算力僅為V3.2的27%，KV緩存降至10%，從底層實(shí)現(xiàn)了成本優(yōu)化。

DeepSeek方面公布的參數(shù)顯示，DeepSeek-V4-Pro激活參數(shù)為49B、預(yù)訓(xùn)練數(shù)據(jù)33T，定位是高性能旗艦；DeepSeek-V4-Flash激活參數(shù)13B、預(yù)訓(xùn)練數(shù)據(jù)32T，主打高速與低成本。

和前代模型相比，DeepSeek-V4-Pro的Agent能力有顯著增強(qiáng)。在Agentic Coding評(píng)測(cè)中，V4-Pro已達(dá)到當(dāng)前開源模型的最佳水平，在其他Agent相關(guān)評(píng)測(cè)中表現(xiàn)也很出色。據(jù)悉，目前DeepSeek-V4已成為DeepSeek內(nèi)部員工使用的Agentic Coding模型，評(píng)測(cè)反饋其使用體驗(yàn)優(yōu)于Sonnet 4.5，交付質(zhì)量接近Claude Opus 4.6非思考模式，但和Opus 4.6思考模式仍有一定差距。

在世界知識(shí)測(cè)評(píng)中，DeepSeek-V4-Pro大幅領(lǐng)先其他開源模型，略遜于頂尖閉源模型Gemini-Pro-3.1。而在數(shù)學(xué)、STEM、競(jìng)賽型代碼的測(cè)評(píng)中，DeepSeek-V4-Pro超越了當(dāng)前所有已公開評(píng)測(cè)的開源模型，可與世界頂級(jí)閉源模型比肩。

與DeepSeek-V4-Pro相比，DeepSeek-V4-Flash在世界知識(shí)儲(chǔ)備方面稍顯遜色，但推理能力與之接近。并且由于模型參數(shù)和激活更小，V4-Flash能提供更快捷、經(jīng)濟(jì)的API服務(wù)。

DeepSeek-V4還開創(chuàng)了一種新的注意力機(jī)制，在token維度進(jìn)行壓縮，結(jié)合DSA稀疏注意力（DeepSeek Sparse Attention），實(shí)現(xiàn)了全球領(lǐng)先的長(zhǎng)上下文能力，且相比傳統(tǒng)方法大幅降低了對(duì)計(jì)算和顯存的需求。

更值得關(guān)注的是，昇騰超節(jié)點(diǎn)全系列產(chǎn)品支持DeepSeek V4系列模型，這也表明DeepSeek釋放出了更多國(guó)產(chǎn)化信號(hào)。

DeepSeek-V4在一份技術(shù)報(bào)告中提到：“在英偉達(dá)GPU和華為昇騰NPU兩個(gè)平臺(tái)上驗(yàn)證了細(xì)粒度EP（專家并行）方案，與強(qiáng)力的非融合（non-fused）基線相比，該方案在通用推理任務(wù)中實(shí)現(xiàn)了1.50 - 1.73倍加速；在對(duì)延遲敏感的場(chǎng)景（如強(qiáng)化學(xué)習(xí)（RL）rollout和高速Agent服務(wù)）中，最高可達(dá)1.96倍加速?！?/p>

DeepSeek強(qiáng)調(diào)，隨著下半年昇騰超節(jié)點(diǎn)全系列產(chǎn)品批量上市，Pro版價(jià)格有望大幅下調(diào)。

DeepSeek-V4發(fā)布后，高盛發(fā)布分析報(bào)告指出，DeepSeek V4的核心意義在于以更低成本支持更復(fù)雜的智能體應(yīng)用落地，從而打開AI應(yīng)用規(guī)?；男驴臻g。對(duì)于納入昇騰超節(jié)點(diǎn)，高盛認(rèn)為DeepSeek的成本競(jìng)爭(zhēng)力將進(jìn)一步強(qiáng)化，為更廣泛的應(yīng)用落地創(chuàng)造條件。此外，在芯片持續(xù)收緊的背景下，中國(guó)頂尖AI模型向國(guó)產(chǎn)算力遷移的趨勢(shì)得到了頭部玩家的明確支持。

高盛報(bào)告還援引新聞報(bào)道稱，騰訊和阿里正在洽談以逾200億美元估值投資DeepSeek，而智譜和MiniMax的最新市值分別約為530億美元和310億美元，這一潛在交易反映出巨頭對(duì)稀缺頂層AI能力的爭(zhēng)奪邏輯。

華泰證券則認(rèn)為，市場(chǎng)容易將V4理解為“降本壓低算力、存儲(chǔ)需求”，但更重要的邊際變化在于長(zhǎng)上下文成本下降后，復(fù)雜Agent、多文檔分析、長(zhǎng)周期任務(wù)、在線學(xué)習(xí)等場(chǎng)景的可用性得到提升，推理調(diào)用量與存儲(chǔ)訪問頻次有望增加。

本文來自微信公眾號(hào)“界面新聞”，作者：宋佳楠，36氪經(jīng)授權(quán)發(fā)布。

本文僅代表作者觀點(diǎn)，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>

免責(zé)聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

華夏電影“超現(xiàn)場(chǎng)”模式：開啟影院體驗(yàn)新變革

粵地雞肴為何獨(dú)得青睞？

杉井奧萊：不止于寧波，邁向區(qū)域標(biāo)桿的進(jìn)階之路

國(guó)產(chǎn)千元包頂流裘真：植鞣皮賽道的突圍之道

北上廣深億元級(jí)豪宅成交翻倍頂豪市場(chǎng)供需呈現(xiàn)新態(tài)勢(shì)

項(xiàng)目推薦

迪瓜租機(jī)

康老板 · 氧療堂

<li id="nol82"></li>

<rt id="nol82"></rt>