欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

新AI模型為何剛推出就優(yōu)勢(shì)不再?

03-06 06:33

本文源自微信公眾號(hào)“Fast Company中文版”,作者C.Stokel-Walker,原標(biāo)題為《為什么新AI模型剛一推出,就失去了優(yōu)勢(shì)?》



當(dāng)下人工智能領(lǐng)域的競(jìng)爭(zhēng)中,技術(shù)迭代速度已不再以年或月為單位,而是縮短至以周計(jì)算。



今年2月初,Anthropic發(fā)布的Opus 4.6曾是該公司的重要里程碑,在多個(gè)領(lǐng)域都達(dá)到了頂尖水準(zhǔn)。但僅一周后,中國(guó)企業(yè)Z.ai就推出了對(duì)標(biāo)Opus的GLM-5模型,且目前沒(méi)有證據(jù)顯示GLM-5存在復(fù)制或借鑒Opus的情況,社交媒體上不少人將其稱為“平替版Opus”。



然而Z.ai的優(yōu)勢(shì)也未持續(xù)太久,在Anthropic被GLM-5追平后不久,GLM-5便被迅速下載、壓縮,進(jìn)而開(kāi)發(fā)出可本地離線運(yùn)行的版本。



外界對(duì)AI企業(yè)如何快速追趕甚至超越競(jìng)爭(zhēng)對(duì)手,尤其是部分中國(guó)企業(yè)能在幾天或幾周內(nèi)推出媲美美國(guó)頂尖模型的產(chǎn)品,一直存在諸多爭(zhēng)議。谷歌長(zhǎng)期以來(lái)都在警示“蒸餾”技術(shù)可能帶來(lái)的風(fēng)險(xiǎn)。



在“蒸餾”過(guò)程中,企業(yè)會(huì)向模型輸入大量提示詞,生成海量回復(fù)數(shù)據(jù)集,從中提取內(nèi)部推理模式與邏輯,再用這些數(shù)據(jù)訓(xùn)練成本更低的復(fù)刻模型。有消息稱,曾有機(jī)構(gòu)向谷歌Gemini模型發(fā)送超10萬(wàn)次提示,試圖破解其強(qiáng)大能力的背后原理。麻省理工學(xué)院專注人工智能政策研究的博士生Shayne Longpre表示:“我確實(shí)感覺(jué)技術(shù)壁壘正在消失?!?/p>



這種變化不僅體現(xiàn)在發(fā)布速度上,還涉及技術(shù)進(jìn)步的本質(zhì)。Longpre指出,最頂尖的閉源模型與開(kāi)放權(quán)重模型之間的前沿差距正急劇縮小,他引用非營(yíng)利研究機(jī)構(gòu)Epoch AI追蹤模型發(fā)展的研究解釋:“目前這一差距大約只有三到六個(gè)月?!?/p>



差距縮小的原因在于,如今大部分技術(shù)進(jìn)展是在模型發(fā)布后實(shí)現(xiàn)的。Longpre解釋,各家公司會(huì)“對(duì)這些系統(tǒng)進(jìn)行不同的強(qiáng)化學(xué)習(xí)或微調(diào),或是提升測(cè)試時(shí)推理能力,或是支持更長(zhǎng)的上下文窗口”,這些操作都大幅縮短了適配周期,“無(wú)需從頭開(kāi)始預(yù)訓(xùn)練全新模型”。



這些迭代式改進(jìn)不斷放大速度優(yōu)勢(shì)?!八麄兠扛粢粌芍芫屯瞥龈鞣N變體版本,”他說(shuō),“就像給普通軟件打補(bǔ)丁一樣?!?/p>



但作為前沿技術(shù)的開(kāi)拓者,美國(guó)AI公司對(duì)這類做法的批評(píng)聲越來(lái)越大。OpenAI在致美國(guó)國(guó)會(huì)議員的備忘錄中指控,DeepSeek通過(guò)蒸餾美國(guó)模型的輸出來(lái)訓(xùn)練具有競(jìng)爭(zhēng)力的系統(tǒng)。





即便不存在嚴(yán)格意義上的“竊取”行為,開(kāi)放權(quán)重生態(tài)也在以前所未有的速度模仿前沿模型的有效創(chuàng)新。



阿姆斯特丹自由大學(xué)研究基礎(chǔ)模型競(jìng)爭(zhēng)問(wèn)題的法學(xué)副教授Thibault Schrepel認(rèn)為,問(wèn)題部分源于模型許可證對(duì)“開(kāi)源”的定義?!拔覀兂B?tīng)到某個(gè)系統(tǒng)是否開(kāi)源的說(shuō)法,”他表示,“但我覺(jué)得這種二元判斷非常局限?!?/p>



Schrepel補(bǔ)充道,仔細(xì)查看許可證實(shí)際條款很重要?!叭粽J(rèn)真研究所有模型的許可證,會(huì)發(fā)現(xiàn)它們對(duì)所謂‘開(kāi)源’模型的使用方式施加了大量限制。”例如Meta的Llama 3許可證對(duì)超大型服務(wù)設(shè)置了觸發(fā)條款限制,小型服務(wù)則不受影響。“如果部署給超過(guò)7億用戶,就必須申請(qǐng)?jiān)S可?!盨chrepel說(shuō),這種雙層體系會(huì)形成灰色地帶,滋生可疑行為。





麻省理工學(xué)院的Longpre表示,市場(chǎng)很可能會(huì)走向分化。一邊是廉價(jià)、性能持續(xù)提升、可本地部署的模型,用于處理日常任務(wù);另一邊是用于高難度、高風(fēng)險(xiǎn)工作的高端前沿系統(tǒng)?!拔艺J(rèn)為基礎(chǔ)水平正在整體提升,”他補(bǔ)充道,并預(yù)測(cè)“會(huì)出現(xiàn)更多價(jià)格親民、可本地部署、體積更小的通用模型”。但他也相信,在關(guān)鍵且專業(yè)的工作中,用戶仍會(huì)“傾向于使用OpenAI、谷歌和Anthropic的模型”。



Longpre還表示,完全阻止模型蒸餾幾乎不可能。他分析,每當(dāng)新模型發(fā)布,競(jìng)爭(zhēng)對(duì)手必然會(huì)嘗試提取并復(fù)制其最優(yōu)秀的特性?!皻w根結(jié)底,我認(rèn)為這是一個(gè)無(wú)法避免的問(wèn)題?!?/p>

本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com