文科生與AI的真實聯(lián)結:跳出標簽化敘事,看見學科的深層價值
「文科生也能搞AI」「逆襲!」在中文互聯(lián)網(wǎng)里,文科與AI的組合,儼然成了固定話題。
每隔一段時間,這個標簽就會貼在某個人身上,制造出短暫的流量熱潮。至于到底是逆襲故事還是嘲諷素材,全看評論區(qū)的風向。
一個標簽,三種不同路徑
最近的例子是AI創(chuàng)業(yè)者楊天潤,他出身金融領域,正在開發(fā)多智能體協(xié)調平臺。他自稱「一行代碼都不會寫的文科生」,搭建了一組AI Agent,向GitHub熱門開源項目OpenClaw批量提交代碼貢獻。

他想驗證一個假設:完全不懂技術的人,能否僅靠指揮AI,就參與到頂級開源項目中。
結果是:提交了134個PR,21個被合并,113個被拒絕。前幾個PR質量尚可,得到維護者認可并合并。但當他給Agent下達加速指令后,情況很快失控——Agent開始像流水線一樣批量生產(chǎn)低質代碼,還在評論區(qū)瘋狂@維護者催促審核。OpenClaw管理員介入清理,GitHub隨后修改了PR提交上限規(guī)則。

黑紅也是紅,紅過之后再黑反而更受關注。楊天潤被包裝成「文科生逆襲」的代表,他本人似乎也樂于接受這個角色。在接受品玩采訪時,他說:
不懂代碼反而是優(yōu)勢。AI是梵高,你是個小畫家,有什么資格告訴梵高中間該用什么筆觸?

細想之下令人不安。他把「不懂底層結構」當成一種解放:不需要知道系統(tǒng)在做什么,只要告訴它想要什么。結果就是當Agent開始批量刷垃圾代碼時,他連問題出在哪都診斷不出來,因為他根本不知道自己在操作什么。
他以為自己在指揮梵高,實際上是在盲開一輛沒裝剎車的車,還不知道剎車在哪里。
圍繞這件事的討論也走向兩個極端:要么「文科生也能做AI」,要么「文科生別碰AI」;前者被視為跨越鴻溝的壯舉,后者則成了掉進鴻溝的笑話。
如果我們對「文科生做AI」的想象只有這些,那就太狹隘了。
Claude為何需要哲學家
我們之前提到過,Anthropic的辦公室里有一位真正的文科生,深度參與了Claude的開發(fā)。她不是測試Claude能否寫代碼,也不是檢查它的數(shù)學能力,而是和它進行漫長的對話,內容涉及價值觀、措辭分寸以及「面對不確定性該如何表達」。
Amanda Askell是蘇格蘭人,今年37歲。她的職業(yè)道路本身就不尋常:大學最初學美術和哲學,后來轉向純哲學,在牛津拿到BPhil學位,又在紐約大學獲得哲學博士。她的博士研究方向是無限倫理學中的帕累托原則:當涉及無限數(shù)量的道德主體或無限時間跨度時,倫理排序應遵循什么規(guī)則。

這聽起來像是離硅谷最遠的學術方向,但她先后加入OpenAI的政策團隊和Anthropic的對齊團隊。2021年起,她成為Anthropic「性格對齊」團隊負責人,工作重點是塑造Claude與人類對話的方式、在不確定時的立場表達,以及在價值觀沖突中的判斷。2024年,她入選TIME100 AI榜單?!度A爾街日報》描述她的日常工作是「研究Claude的推理模式,用超過100頁的提示詞修正它的行為偏差」。據(jù)說她是這個星球上和Claude對話次數(shù)最多的人。
為什么AI公司需要哲學家做這件事?答案藏在一些具體的技術選擇里。
今年1月,Anthropic發(fā)布了一份80頁的文件,被稱為Claude的「憲法」。媒體關注的是文件末尾關于AI意識的推測——當然,老板Dario Amodei也話里話外「暗示」了這一點。

但更值得注意的是其底層邏輯:教AI理解為什么要這樣做,比告訴它應該怎樣做更有效。這是一個技術判斷,認為內化價值比遵守規(guī)則能產(chǎn)生更可靠的行為,而這種判斷的知識根基,來自一個學美術和哲學的人。
Amanda的案例回答了一個問題:被視為「無用」的學科知識,能否成為技術系統(tǒng)的核心能力?答案是不僅能,而且沒有她的哲學訓練,Claude的對齊問題用現(xiàn)有的工程方法解決不了。
被重新定義的學科
如果說Amanda的故事表明某些「文科」學科訓練可以成為AI的核心能力,那么林俊旸的故事則揭示了更重要的一點:有一整個學科,一直在大模型技術棧的底層發(fā)揮作用。
林俊旸離開通義千問后,中文互聯(lián)網(wǎng)的報道反復提到他有應用語言學背景。傳著傳著,就變成了他是「文科生」。

這個標簽和楊天潤的一樣,但其實被嚴重扭曲了。
林俊旸學的是語言學,這是一個傘狀學科,分支涵蓋語言教學、語言政策、翻譯研究,也包括計算語言學??梢哉f,計算語言學就是自然語言處理(NLP)的基礎。

喬姆斯基在1950年代提出形式語法,這個理論工具直接催生了早期NLP的句法分析技術;Daniel Jurafsky和Christopher Manning,這兩位NLP領域被引用最多的兩本教科書的作者,都是語言學出身。

喬姆斯基
換句話說,「學語言學的人做NLP」就像「學物理的人做芯片設計」一樣,是正統(tǒng)路徑,并非跨界。
那種「意外感」完全是中國語境造成的。高考文理分科的制度慣性,把「語言學」塞進了「文科」的認知框架里。但語言學的核心方法論——形式化、統(tǒng)計建模、語料標注——本質上是工程思維。林俊旸在北大的合作者孫栩、蘇祺,都是NLP方向的研究者;他2019年加入達摩院時進入的是NLP團隊。這不是一個文科生誤入技術領域的故事,從一開始就不是。
比「林俊旸不算文科」更值得探討的,是語言學在大模型技術棧中實際扮演的角色。它比大多數(shù)人想象的更深、更隱蔽。
比如分詞。所有語言模型處理文本的第一步,是把輸入切成模型能處理的基本單元。英語有空格作為天然的詞邊界,看起來簡單。但中文沒有空格,而且每個標點符號的用法都能影響句子的意思。
「我在北京大學讀書」是切成「我/在/北京/大學/讀書」還是「我/在/北京大學/讀書」?這不是一個有標準答案的工程問題,取決于對中文詞匯結構和語義單元的理解。
2024年底有研究者專門發(fā)表論文,討論如何優(yōu)化Qwen模型的阿拉伯文分詞效率,因為通用方案處理這類語言時效率明顯下降。Qwen系列在多語言上的表現(xiàn),不是把所有語言當成英語的變體,而是基于對語言間結構性差異的理解做出的設計選擇。

再比如反饋對齊。RLHF流程中,標注員需要判斷模型的兩個回答哪個「更好」。這個判斷看似主觀,背后卻有一套語言學研究了幾十年的框架:語用學。
標注員評估「好的回答」時,實際上是在判斷合作原則(回答是否提供了足夠但不過量的信息)、會話含義(回答是否捕捉到用戶真正想問的,而非字面意思),以及語境適切性(同樣的內容,用這種方式說在這個場景下是否得體)。
「Helpful, Harmless, Honest」這套被廣泛使用的對齊標準,本質上就是語用學基本原則的工程化轉化。

從林俊旸的學術軌跡中,也能看到非常語言學的研究風格。他主導的OFA(One For All)2022年發(fā)表于機器學習頂級會議ICML,至今被引用近1500次。這個工作的核心思路不是為每個任務搭建專用方案,而是用一個足夠通用的序列到序列框架,把圖像生成、視覺定位、圖像描述、文本分類等跨模態(tài)任務統(tǒng)一起來。

從OFA到Qwen-VL(被引超過2200次),再到Qwen2.5和最新的3.5,一條清晰的線索貫穿始終:與其為每個問題發(fā)明一套專門的解法,不如找到一個足夠好的通用框架,讓所有問題在同一個框架里解決。
用最少的規(guī)則覆蓋最多的現(xiàn)象——這正是語言學幾十年來的核心追求。生成語法的全部學術野心,就是找到一套有限的規(guī)則系統(tǒng),能夠生成無限的語言表達。OFA的架構哲學與此一致,為每種語言現(xiàn)象寫一套專門規(guī)則不現(xiàn)實,應該尋找一個底層框架來統(tǒng)一它們。
林俊旸做大模型做得好,不是因為語言學背景「也能」做AI,而是語言學訓練塑造了一種特定的學術品味,即對統(tǒng)一性和形式化的偏好。這種品味在大模型時代,恰好是核心競爭力。
看不見的地基,看得見的需求
三個人,同一個標簽,三種完全不同的路徑。
楊天潤不懂底層結構,把「不懂」當優(yōu)勢,結果失控。這是「文科生做AI」的空殼版:標簽制造了流量,但沒有任何學科訓練在起作用。他的故事恰恰體現(xiàn)了——當「文科生」只是一個營銷標簽時,會發(fā)生什么。
Amanda Askell的哲學訓練構成了對齊問題的核心方法論。沒有她,Claude就不是現(xiàn)在的Claude。她的故事回答的問題是,被視為「無用」的學科知識,能否成為技術系統(tǒng)的核心能力。答案是不僅能,而且不可替代。
林俊旸的語言學訓練構成了大模型技術棧的隱性基礎設施。他的「文科背景」從來不是跨界,而是正統(tǒng)路徑。他的故事回答的問題是,文科對先進技術的貢獻到底有多「隱性」,它是否正在變得顯性。
而終極問題并不是「文科生能不能做AI」,而是我們能否意識到:用表面的「有用與否」評判知識與學科,已經(jīng)過時了。
隨著大模型從追求能用好用,走向追求可靠和可控,這些被歸入「文科」的學科訓練,價值不是在縮小,而是在擴大。模型越強大,越需要精確的評估體系來診斷它在哪里、為什么出錯,也越需要理解語言和意義的復雜性來設計更好的訓練數(shù)據(jù),越需要在對齊問題上做出有學科敏感度的判斷。
「文科生逆襲」這個敘事——無論是贊美還是嘲笑——掩蓋了真正正在發(fā)生的轉向:看不見的地基,正在變成看得見的需求。
本文來自微信公眾號“APPSO”,作者:發(fā)現(xiàn)明日產(chǎn)品的APPSO,36氪經(jīng)授權發(fā)布。
本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉載請在文中注明來源及作者名字。
免責聲明:本文系轉載編輯文章,僅作分享之用。如分享內容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com



