全是AI編造內(nèi)容的網(wǎng)站,反倒成了當(dāng)下互聯(lián)網(wǎng)最坦誠(chéng)的存在
本文來(lái)自微信公眾號(hào):APPSO,作者:發(fā)現(xiàn)明日產(chǎn)品的
我們打開維基百科搜索詞條,都希望得到準(zhǔn)確真實(shí)的內(nèi)容,至少在AI發(fā)展到現(xiàn)在的階段,總得有一個(gè)平臺(tái)能給我們靠譜的真實(shí)信息吧。想找真實(shí)內(nèi)容當(dāng)然可以,但如果你在Halupedia搜索詞條,得到的也是「真相」——只不過是這個(gè)網(wǎng)站三秒鐘之前才剛剛造出來(lái)的真相。
Halupedia是一個(gè)外觀和維基百科幾乎一模一樣的網(wǎng)站,但它上面每一篇詞條內(nèi)容,全都是AI生成的幻覺內(nèi)容。

你輸入一個(gè)想要查詢的詞條,如果這個(gè)詞條之前從來(lái)沒有人搜索過,大語(yǔ)言模型就會(huì)在幾秒鐘之內(nèi)給你生成一篇措辭嚴(yán)謹(jǐn)、看著像模像樣、還帶著參考文獻(xiàn)、滿是學(xué)術(shù)氛圍的百科文章——內(nèi)容講的是一個(gè)從來(lái)沒在這個(gè)世界上存在過的東西。如果這個(gè)詞條已經(jīng)被人搜過了,你看到的就是之前用戶觸發(fā)生成的那篇幻覺內(nèi)容,這個(gè)網(wǎng)站甚至還做了交叉引用,標(biāo)注了不存在的學(xué)術(shù)期刊,連語(yǔ)氣都模仿了19世紀(jì)學(xué)者考證的腔調(diào)。所有細(xì)節(jié)都做得讓人信服,可惜所有內(nèi)容都是假的。
說它是行為藝術(shù)也行,說它會(huì)成為未來(lái)互聯(lián)網(wǎng)的數(shù)據(jù)污染源也對(duì),答案可能是:它兩者都是。
維護(hù)虛構(gòu)世界的自洽世界觀
如果Halupedia只是一個(gè)隨便瞎編亂造內(nèi)容的隨機(jī)生成工具,它早就和網(wǎng)上其他無(wú)數(shù)AI玩具一樣被淹沒了。真正讓它有意思的是一個(gè)設(shè)計(jì)細(xì)節(jié):它一直在維護(hù)自己這個(gè)小世界的邏輯自洽。
每當(dāng)AI生成一篇新的詞條文章,文章里所有的超鏈接都會(huì)被加上隱藏的元數(shù)據(jù),也就是上下文描述,會(huì)提前說明這個(gè)鏈接指向的、還沒生成的詞條,應(yīng)該包含哪些核心內(nèi)容。等之后真的有人點(diǎn)擊這個(gè)鏈接,系統(tǒng)就會(huì)把所有指向這個(gè)詞條的元數(shù)據(jù)匯總起來(lái),當(dāng)作已經(jīng)確定的「既定事實(shí)」放進(jìn)生成提示詞里,讓AI按照這個(gè)設(shè)定生成內(nèi)容。

很奇妙的一點(diǎn)是,在這里AI可以編,可以瞎扯,但絕對(duì)不能前后矛盾,哪怕所有信息都是編出來(lái)的,整個(gè)世界觀也要保持邏輯一致。
這套機(jī)制叫做link hints,它讓Halupedia從一個(gè)隨便出幻覺的生成工具,變成了一個(gè)內(nèi)在邏輯自洽的完整虛構(gòu)宇宙。寫過小說、愛玩開放世界游戲的人一眼就能看懂,這就是世界觀搭建和管理,只不過管理者不是人類作者,而是數(shù)據(jù)庫(kù)加上系統(tǒng)提示詞機(jī)制。
換句話說,Halupedia本身就是一部沒有主作者的集體創(chuàng)作小說,每個(gè)點(diǎn)擊鏈接的用戶都在不知不覺中參與了創(chuàng)作,但是沒有一個(gè)人能拿到完整的全本。從某種程度上來(lái)說,它其實(shí)復(fù)刻了維基百科「眾人拾柴火焰高」的協(xié)作模式,只不過過程更簡(jiǎn)單,你隨便輸個(gè)詞,剩下的交給AI生成就好了。
它是照向互聯(lián)網(wǎng)未來(lái)的一面鏡子
但Halupedia不只是一個(gè)好玩的玩具,它的存在戳中了一個(gè)已經(jīng)在發(fā)生、讓人不安的問題:當(dāng)AI生成的內(nèi)容反過來(lái)去訓(xùn)練下一代AI的時(shí)候,最后會(huì)變成什么樣?
現(xiàn)在的第一代大語(yǔ)言模型,訓(xùn)練數(shù)據(jù)都來(lái)自人類創(chuàng)作的互聯(lián)網(wǎng)內(nèi)容——維基百科的詞條、論壇用戶發(fā)帖、新聞報(bào)道、學(xué)術(shù)論文。這些數(shù)據(jù)雖然良莠不齊,但至少都來(lái)自人類真實(shí)的經(jīng)驗(yàn)和知識(shí)體系??呻S著AI生成內(nèi)容在互聯(lián)網(wǎng)上呈爆炸式增長(zhǎng),未來(lái)大模型的訓(xùn)練數(shù)據(jù)肯定會(huì)不可避免地包含大量AI自己生成的內(nèi)容。真實(shí)有效的信息會(huì)被無(wú)用的噪聲稀釋,每一輪訓(xùn)練都像是在復(fù)印一份已經(jīng)模糊不清的復(fù)印件,越復(fù)印越模糊。
Halupedia的開發(fā)者Bart?omiej Strama顯然也意識(shí)到了這個(gè)問題,當(dāng)有人給他捐token使用費(fèi)用的時(shí)候,他是這么回復(fù)的:

——你為污染大語(yǔ)言模型訓(xùn)練數(shù)據(jù)做出的貢獻(xiàn),終將造福全社會(huì)。
嘲諷感直接拉滿,你甚至猜不出來(lái)他是在說反話還是認(rèn)真的,事實(shí)上,Halupedia的內(nèi)容雖然是即時(shí)生成的,但不可能百分之百全是幻覺,大語(yǔ)言模型的生成機(jī)制就決定了,它只能在已有的知識(shí)縫隙里編造內(nèi)容。

就像圖里舉的例子,「迦勒底」真實(shí)存在,「算術(shù)」也是真的,但「迦勒底算術(shù)」就是編出來(lái)的假東西,幻覺出現(xiàn)在組合的層面,而不是構(gòu)成內(nèi)容的單個(gè)元素上。就像人不可能憑空夢(mèng)到一種你從來(lái)沒見過的顏色,大語(yǔ)言模型也不可能編出一個(gè)和訓(xùn)練數(shù)據(jù)完全沒關(guān)系的全新概念。
這恰恰是它最危險(xiǎn)也最迷人的地方:它的幻覺之所以看起來(lái)這么可信,就是因?yàn)槊科恼吕锒疾亓舜罅空鎸?shí)的細(xì)節(jié)。真實(shí)的年代、真實(shí)的地名、真實(shí)的學(xué)術(shù)文體、真實(shí)的引用格式,可架在這些真實(shí)細(xì)節(jié)之上的核心內(nèi)容,卻是假的。
如果Halupedia的內(nèi)容被未來(lái)的搜索引擎爬蟲抓去,被未來(lái)的大模型當(dāng)作訓(xùn)練數(shù)據(jù),這些看起來(lái)一本正經(jīng)的幻覺文章,就會(huì)變成下一代AI「知識(shí)體系」的一部分。
一個(gè)故意造幻覺的網(wǎng)站,最后可能會(huì)讓所有AI都產(chǎn)生一模一樣的幻覺。
當(dāng)編造的幻覺照進(jìn)真實(shí)世界
Halupedia現(xiàn)在遇到的最大問題,恰恰暴露了它作為「開放式虛構(gòu)創(chuàng)作系統(tǒng)」的弱點(diǎn)。因?yàn)檎l(shuí)都可以輸入任意詞條來(lái)生成內(nèi)容,有些用戶開始輸入種族主義或者帶冒犯性的內(nèi)容,網(wǎng)站管理方現(xiàn)在也在想辦法解決這個(gè)問題。
這其實(shí)是所有開放式AI系統(tǒng)都會(huì)碰到的困境:你給了用戶創(chuàng)作的自由,就得承擔(dān)有人濫用自由的代價(jià)。Halupedia的開發(fā)者也承認(rèn),現(xiàn)在的內(nèi)容審核「有時(shí)候過于嚴(yán)格」,但就算這樣還是不夠用。
這就形成了一個(gè)有意思的悖論:在這個(gè)所有東西都是虛構(gòu)的世界里,唯一真實(shí)的傷害,就是用戶從現(xiàn)實(shí)世界帶進(jìn)來(lái)的惡意。
從某種角度來(lái)說,Halupedia可能是現(xiàn)在互聯(lián)網(wǎng)上最誠(chéng)實(shí)的AI項(xiàng)目,不是因?yàn)樗f的都是真話——恰恰相反,它說的全是假話,但它是唯一一個(gè)從一開始就明明白白告訴你「這里沒有真東西」的平臺(tái)。在現(xiàn)在這個(gè)越來(lái)越多AI生成內(nèi)容假裝成事實(shí)的互聯(lián)網(wǎng)上,Halupedia至少給內(nèi)容貼了清晰的標(biāo)簽:這就是編造的幻覺,已經(jīng)加工潤(rùn)色過了,你隨便看著玩就好。
可問題是,等你關(guān)掉Halupedia,回到谷歌的搜索結(jié)果頁(yè),你還能分清楚哪些是編造的幻覺,哪些是真實(shí)內(nèi)容嗎?
說不定整個(gè)互聯(lián)網(wǎng),正在一點(diǎn)點(diǎn)變成一個(gè)沒貼標(biāo)簽的Halupedia。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com





