指責(zé)中國(guó)公司竊技術(shù)的Anthropic,竟是北美最大“偷子”?
中美AI競(jìng)賽舞臺(tái)上,一場(chǎng)“賊喊捉賊”的年度大戲正拉開帷幕。
2月23日,TechCrunch爆出的新聞瞬間點(diǎn)燃全球AI領(lǐng)域輿論場(chǎng)。
報(bào)道稱,以“AI安全”為招牌的明星創(chuàng)業(yè)公司Anthropic,公開指控DeepSeek、Moonshot AI和MiniMax三家國(guó)內(nèi)頂尖AI大模型公司,通過(guò)系統(tǒng)性欺詐手段利用其Claude模型訓(xùn)練優(yōu)化自身模型。
Anthropic公布的數(shù)據(jù)顯示,三家公司共創(chuàng)建超2.4萬(wàn)個(gè)虛假賬戶,與Claude模型交互約1600萬(wàn)次。Anthropic聲稱這些行為旨在通過(guò)“蒸餾”提取Claude核心能力,“抄近道”提升自身模型性能。
這番控訴精準(zhǔn)踩中中美AI博弈痛點(diǎn),Anthropic給自己貼上“知識(shí)產(chǎn)權(quán)受害者”標(biāo)簽,還在輿論場(chǎng)給中國(guó)對(duì)手扣上“抄襲者”帽子。
諷刺的是,科技圈記憶未退化。就在去年,這位自詡“行業(yè)標(biāo)桿”的控告者,剛因非法用盜版書籍訓(xùn)練模型,掏出15億美元“買路錢”平息版權(quán)官司。Anthropic此舉,頗有“洗白后反手舉報(bào)前同行”的意味。
事件發(fā)酵后,特斯拉CEO埃隆·馬斯克在社交平臺(tái)X發(fā)出靈魂拷問(wèn):“他們(中國(guó)公司)怎敢竊取Anthropic從人類程序員那竊取的東西?”還表示“我們(xAI)不像Anthropic那樣自鳴得意、道貌岸然、虛偽做作”。

當(dāng)曾經(jīng)的“大盜”指責(zé)別人“偷竊”,我們不禁要問(wèn):這是維護(hù)知識(shí)產(chǎn)權(quán)的正義之舉,還是激烈競(jìng)爭(zhēng)焦慮下,“前科犯”通過(guò)攻擊對(duì)手掩蓋自身“原罪”的公關(guān)策略?
硅谷AI寵兒Anthropic,到底是技術(shù)創(chuàng)新捍衛(wèi)者,還是北美科技圈最大“偷子”?
“捉賊”的Anthropic,忘了自己發(fā)家路?
深入探討Anthropic“黑歷史”前,需先厘清這次指控核心“蒸餾”。
AI領(lǐng)域中,“蒸餾”是常見模型壓縮和知識(shí)遷移技術(shù),簡(jiǎn)單說(shuō)就是用更大更強(qiáng)的“教師模型”輸出來(lái)訓(xùn)練更小更輕量的“學(xué)生模型”。
通過(guò)模仿“教師模型”對(duì)大量問(wèn)題的解答,“學(xué)生模型”能學(xué)習(xí)其邏輯推理和知識(shí)組織能力,實(shí)現(xiàn)性能快速追趕。
這種做法是否構(gòu)成“竊取”?在法律和倫理上都存在巨大爭(zhēng)議的灰色地帶。
時(shí)間回到2025年初,DeepSeek憑借低研發(fā)成本的R1模型橫掃全球、讓硅谷恐慌時(shí),OpenAI曾扮演今天Anthropic的角色,同樣聲稱抓到DeepSeek“蒸餾”其先進(jìn)模型的證據(jù),引發(fā)一場(chǎng)口水戰(zhàn)。
但從技術(shù)角度看,這并非直接復(fù)制模型代碼或權(quán)重參數(shù),更像學(xué)徒觀摩大師作畫,通過(guò)模仿學(xué)習(xí)風(fēng)格技巧,而非直接偷畫作。許多開源模型和研究項(xiàng)目都在探索模型蒸餾,以期用更低成本實(shí)現(xiàn)更高性能。
然而從商業(yè)角度,大型模型公司都在用戶服務(wù)條款中明令禁止此類行為。它們投入數(shù)十億乃至上百億美元研發(fā)成本和算力資源,模型輸出(或API調(diào)用)被視為核心商業(yè)資產(chǎn)。
允許競(jìng)爭(zhēng)對(duì)手無(wú)限制“蒸餾”其模型,無(wú)異于默許對(duì)方用極低成本復(fù)制核心競(jìng)爭(zhēng)力,顯然不可接受。
因此,Anthropic的指控在“違反服務(wù)條款”上站得住腳,但將其上升到“竊取技術(shù)”甚至“商業(yè)間諜”高度,則有擴(kuò)大商業(yè)糾紛的嫌疑。
畢竟若API公開可用,利用其輸出來(lái)研究或訓(xùn)練,行為定性遠(yuǎn)比直接破解服務(wù)器、竊取源代碼復(fù)雜得多。
這場(chǎng)爭(zhēng)論本質(zhì)是AI時(shí)代知識(shí)邊界的重新定義:模型輸出究竟是受保護(hù)的知識(shí)產(chǎn)權(quán),還是可學(xué)習(xí)借鑒的公開知識(shí)?在問(wèn)題無(wú)明確答案前,Anthropic的指控雖聲量大,法理和道義基礎(chǔ)卻并非堅(jiān)不可摧。
更何況,這位“原告”自己攫取知識(shí)用于模型訓(xùn)練時(shí),手段遠(yuǎn)比“蒸餾”粗暴直接。
15億美元和解金,撕開AI“原罪”遮羞布
在高舉道德大棒敲打同行前,這位自封的“AI版權(quán)警察”,剛為自己的“盜竊行為”交完一筆驚天“罰款”。
時(shí)間回到2025年,Anthropic正深陷“Bartzv.Anthropic”法律危機(jī)。多位美國(guó)作家指控Anthropic訓(xùn)練Claude系列模型時(shí),非法使用數(shù)百萬(wàn)本受版權(quán)保護(hù)的書籍。
這些書籍并非來(lái)自合法購(gòu)買渠道,而是直接從LibGen、Sci-Hub鏡像站PiLiMi等著名盜版網(wǎng)站大規(guī)模下載。
這是AI行業(yè)秘而不宣的“秘密”,為獲得高質(zhì)量、結(jié)構(gòu)化訓(xùn)練語(yǔ)料,許多公司都將目光投向匯集人類幾乎所有出版知識(shí)的盜版書庫(kù)。
法庭上,Anthropic試圖用“合理使用”原則辯護(hù),稱將書籍文本用于訓(xùn)練AI模型是“轉(zhuǎn)換性使用”,目的是提取統(tǒng)計(jì)模式構(gòu)建語(yǔ)言能力,不構(gòu)成侵權(quán)。
但主審法官未完全采納這一說(shuō)法,法院裁決在AI訓(xùn)練數(shù)據(jù)合法性上劃下關(guān)鍵紅線。
判決認(rèn)為,若數(shù)據(jù)合法獲?。ㄈ缳?gòu)買并掃描書籍),用于AI訓(xùn)練或許可視為合理使用;但從一開始通過(guò)非法手段(從盜版網(wǎng)站下載)獲取數(shù)據(jù),行為本身就構(gòu)成版權(quán)侵權(quán),后續(xù)任何使用都無(wú)法用“合理使用”豁免。
簡(jiǎn)言之,法院裁決明確:AI“煉金術(shù)”再神奇,也不能建立在盜竊來(lái)的原材料之上。
這一判決直接判負(fù)Anthropic。據(jù)估算,若官司繼續(xù),所有侵權(quán)指控成立,按每部作品最高15萬(wàn)美元法定賠償金計(jì)算,潛在罰金或?yàn)樘煳臄?shù)字。為避免公司破產(chǎn),Anthropic最終選擇妥協(xié)。
2025年9月,雙方達(dá)成和解協(xié)議,Anthropic同意向作家和出版商支付15億美元和解金,覆蓋約50萬(wàn)部作品,平均每本書“贖身價(jià)”約3000美元。作為和解一部分,Anthropic還被要求銷毀所有從盜版渠道獲取的訓(xùn)練數(shù)據(jù)。
這起案件是AI領(lǐng)域有史以來(lái)金額最大的版權(quán)和解案,也成了標(biāo)志性事件,將以“AI安全倫理”領(lǐng)軍者自居的Anthropic釘在“竊取數(shù)據(jù)”的恥辱柱上——他們?yōu)榇蛟霤laude的智慧,盜版了整個(gè)圖書館。
“百步笑五十步”的鬧劇
一邊擦著偷吃版權(quán)紅利的嘴,一邊義憤填膺指責(zé)別人“白嫖”,這場(chǎng)硅谷大戲荒誕感拉滿。
Anthropic指控中國(guó)公司“竊取”其模型能力時(shí),似乎忘了Claude本身的能力,有相當(dāng)一部分建立在“竊取”來(lái)的書籍知識(shí)之上,這讓其指控格外滑稽虛偽。
馬斯克的嘲諷雖刻薄,卻精準(zhǔn)抓住事件核心矛盾:靠“偷”起家的公司,如今搖身一變成知識(shí)產(chǎn)權(quán)捍衛(wèi)者,本身就是絕妙的黑色幽默。

著名程序員、科技博主GergelyOrosz也發(fā)表類似看法:“抱歉,但Anthropic不能兩面討好……別忘了Claude是如何訓(xùn)練出來(lái)的?用的是受版權(quán)保護(hù)的書籍,直到被起訴后才向版權(quán)方付費(fèi)?!?/p>

程序員社區(qū)和網(wǎng)絡(luò)論壇上,類似質(zhì)疑聲此起彼伏。一位Reddit用戶直言:“Anthropic盜版數(shù)百萬(wàn)本書籍,現(xiàn)在卻大談責(zé)任與合規(guī)……如果你真信他們那套說(shuō)辭,未免太天真了?!?/p>
面對(duì)輿論反噬,Anthropic的辯解蒼白無(wú)力,稱訓(xùn)練數(shù)據(jù)包含部分合法來(lái)源,且已通過(guò)支付15億美元和解金“解決”歷史問(wèn)題。
這套邏輯顯然無(wú)法服眾,支付罰款或和解金本質(zhì)是對(duì)過(guò)往侵權(quán)行為的補(bǔ)償,或許能了結(jié)法律糾紛,卻無(wú)法抹去行為本身的不道德性。
這就像小偷被抓后退還贓物并繳罰款,轉(zhuǎn)頭就義憤填膺指責(zé)別人偷他東西,無(wú)論從哪個(gè)角度看都缺乏說(shuō)服力。
更深層次的問(wèn)題在于,Anthropic支付的15億美元,究竟是真心悔過(guò)的“賠償”,還是迫于無(wú)奈的“贖罪券”,抑或是獲取海量高質(zhì)量數(shù)據(jù)的“成本”?從其如今高高在上的道德姿態(tài)看,后者可能性更大。
他們似乎認(rèn)為,一旦花錢“擺平”過(guò)去,就獲得了道德新生,可站在制高點(diǎn)審判他人。
然而,互聯(lián)網(wǎng)是有記憶的。
不過(guò)將Anthropic案例放大到整個(gè)AI行業(yè),會(huì)發(fā)現(xiàn)更普遍的困境:幾乎所有頭部大模型公司的崛起,都離不開對(duì)海量互聯(lián)網(wǎng)數(shù)據(jù)的“野蠻”抓取,其中必然包含大量受版權(quán)保護(hù)的內(nèi)容,這幾乎是整個(gè)行業(yè)的“原罪”。
從OpenAI到Google再到Anthropic,它們的模型能展現(xiàn)驚人智能,正是因?yàn)椤伴喿x”了人類有史以來(lái)幾乎所有公開文本和圖像。在此過(guò)程中,是否獲得每一份資料的授權(quán),是被刻意模糊的問(wèn)題。
但Anthropic的特殊之處,僅在于它做得太過(guò)火,直接端掉整個(gè)盜版圖書館,還被抓個(gè)正著,最終付出沉重代價(jià)。
從這個(gè)角度看,Anthropic對(duì)國(guó)內(nèi)公司的指控,暴露了AI巨頭們危險(xiǎn)的雙重標(biāo)準(zhǔn):“我可以用全世界的數(shù)據(jù)訓(xùn)練我的模型,但你不能用我的模型輸出來(lái)訓(xùn)練你的模型。”
這背后既有商業(yè)利益考量,也有地緣政治影子。
商業(yè)上,AI大模型公司正試圖構(gòu)建全新商業(yè)模式閉環(huán),通過(guò)提供API服務(wù)將模型“智能”作為可計(jì)價(jià)商品出售。
若允許競(jìng)爭(zhēng)對(duì)手通過(guò)“蒸餾”低成本復(fù)制這種智能,整個(gè)商業(yè)模式根基都會(huì)被動(dòng)搖。因此,它們必須將“蒸餾”定義為非法行為,動(dòng)用一切輿論和法律工具打擊。
地緣政治層面,Anthropic的指控完美契合老美延緩國(guó)內(nèi)AI技術(shù)發(fā)展的戰(zhàn)略意圖,通過(guò)將商業(yè)競(jìng)爭(zhēng)上升為“技術(shù)盜竊”,為進(jìn)一步技術(shù)封鎖和出口管制制造輿論基礎(chǔ)。
這使得Anthropic的商業(yè)行為帶上濃厚“政治正確”色彩,既能打擊競(jìng)爭(zhēng)對(duì)手,又能迎合國(guó)內(nèi)政治氣候。
然而,這種建立在雙重標(biāo)準(zhǔn)之上的指控,終將反噬自身。當(dāng)行業(yè)領(lǐng)導(dǎo)者本身通過(guò)打破規(guī)則、游走法律邊緣獲得優(yōu)勢(shì)時(shí),就喪失了為整個(gè)行業(yè)制定規(guī)則的合法性。
對(duì)于Anthropic來(lái)說(shuō),在教育別人如何“負(fù)責(zé)任”之前,或許應(yīng)先向公眾更坦誠(chéng)地解釋:自己正義凜然的“捉賊人”面孔下,曾是北美最大的AI“偷子”。
本文來(lái)自微信公眾號(hào)“超聚焦foci”,作者:方文三,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com




