欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

專治AI說謊,25歲天才少女公司估值過百億

財富故事
1分鐘前

25歲的洪樂潼,最近在硅谷火了。

 

這個來自廣東的女孩,17歲考入MIT,三年修完數(shù)學和物理雙學位,后來又進入斯坦福深造。

 

按照硅谷最熟悉的那套敘事,她是“天才少女創(chuàng)業(yè)者”的模板人物。

 

但洪樂潼真正讓人記住的,不是履歷,而是她做的事太反常識。

 

當整個AI行業(yè)都在追逐更大的模型、更強的生成能力、更像人的表達時,她偏偏轉身去做了一件最不性感、也最難商業(yè)化的事:用數(shù)學驗證AI。

 

她創(chuàng)辦的公司叫Axiom,成立不足兩年,員工只有20多人,最近拿下2億美元A輪融資,投后估值高達16億美元,折合人民幣超110億元。

 

Axiom不做聊天機器人,不做文生圖,也不跟風大語言模型的熱潮。它做的是“形式化驗證”。

 

說白了,就是想用數(shù)學和邏輯,把AI每一步推理都變成可以檢查、可以證明、可以追責的東西。

 

這聽起來很冷門,但它瞄準的,卻是大模型最麻煩的軟肋——幻覺。

 

現(xiàn)在的AI最大的問題不是不夠強,而是不夠可靠。它可以把答案說得很像對的,甚至真的做對題,但你沒法確認它到底是真的推出來了,還是只是“猜對了”。而Axiom要做的,就是把這種模糊狀態(tài),變成一種可驗證的確定性過程。

 

這也是為什么,當洪樂潼拿著這個想法去融資時,迎面撞上的不是掌聲,而是一個極其現(xiàn)實的問題:“數(shù)學怎么賺錢?”

 

01迎難而上的天才少女

 

洪樂潼的辦公室在硅谷帕洛阿爾托大學大道,距離斯坦福大學步行只要半個小時。斯坦福是她博士生涯的起點,但學位還沒有念完,她就退學創(chuàng)業(yè)了。

 

事實上,早在博士在讀期間,洪樂潼就已經(jīng)注冊了公司。公司取名Axiom,名字源自數(shù)學術語“公里”,“我想從公理出發(fā),打造一個能夠自我改進的超級智能推理器?!?/p>

 

 

一個24歲的博士生,沒錢沒人沒產(chǎn)品,僅憑一個想法,她就拿下了960萬美元的種子輪投資。

 

憑什么?

 

要知道現(xiàn)有的大模型本質上是概率黑盒,通過海量數(shù)據(jù)學習模式,然后基于統(tǒng)計規(guī)律給出答案。推理過程無法被量化,所以會胡說、會出錯。

 

洪樂潼要做的就是用數(shù)學公理和形式化驗證,讓AI每一步推理都可證明,可以直接面向金融、軍工、芯片和自動駕駛等對可靠性要求極高的市場。

 

她做的事顯然擊中了AI 最大痛點,解決幻覺與可靠性的問題。

 

更何況,早期投資投人,她本人也是不折不扣的跨學科天才學霸。

 

洪樂潼從小就展現(xiàn)出了驚人的數(shù)學天賦。2001年,她出生于廣州市天河區(qū),曾就讀于華南師大附中。高一時,她就在全國數(shù)學奧林匹克選拔賽中晉級,并在華羅庚杯、全國高中數(shù)學聯(lián)賽中屢獲佳績。

 

正是在奧數(shù)集訓中,她對研究型數(shù)學產(chǎn)生了興趣。

 

2018年,17歲的她被MIT錄取,3年就修完了數(shù)學和物理雙學位,不僅發(fā)表了9篇學術論文,還獲得全美女性數(shù)學家最高榮譽Alice T. Schafer數(shù)學獎等諸多榮譽。

 

此后,她獲得牛津大學羅德獎學金,她沒有繼續(xù)深耕數(shù)學,轉頭去學了神經(jīng)科學,因為想“構建跨越科學領域的認知體系”。

 

基于這一目標,她同時在倫敦大學學院蓋茨比計算神經(jīng)科學中心開展深度學習研究,該中心由“深度學習之父”杰弗里·辛頓聯(lián)合創(chuàng)立。也正是在此期間,她正式踏足AI領域,接觸到許多最前沿的課題。隨后她又進入斯坦福大學,攻讀數(shù)學與法律雙學科博士。

 

2024年,ChatGPT o3被曝光在數(shù)學測試中存在“作弊”嫌疑,全球輿論嘩然。

 

作為斯坦福數(shù)學博士的洪樂潼也在社交媒體上發(fā)表了看法:“OpenAI大模型在數(shù)學測試中表現(xiàn)優(yōu)秀,大概率是因為訓練數(shù)據(jù)中提前泄題了。在一些測試中,大模型回答的準確率雖然高達96%,但一旦展示推理過程,得分率就降至5%?!?/p>

 

面對行業(yè)痛點,一種名為Lean的語言闖入她的視線,也讓她嗅到了創(chuàng)業(yè)機會。

 

與自然語言不同,Lean語言是一個非常神奇的、可以自驗證的數(shù)學編程語言。洪樂潼打了個比方:“如果用英語寫出數(shù)學證明,我沒辦法知道一個5000行的證明是否正確,需要找高水平的專家驗證。但Lean是自驗證的,只要跑通了就是對的?!?/p>

 

Lean的邏輯是把自然語言或非形式化驗證,轉成機器可檢查的形式化驗證。

 

那啥是形式化驗證呢?

 

普通的AI,你只能用它的答案來判斷它是不是理解這個問題,但你不知道它中間有沒有瞎蒙。

 

形式化驗證是要求你把每一步都寫成機器能檢查的邏輯鏈條。只要中間有一步跳了、糊了、偷懶了,它就不給過。

 

之所以形式化驗證能治大模型會幻覺,是因為形式化驗證不管你答案如何,只要你的結論是從前提里一步步合法推出來的,那答案就是對的,從而避免了模型產(chǎn)生幻覺。

 

所以Axiom做的,就是讓大模型負責猜想和搜索,讓Lean負責驗算和判斷。如果Lean檢查發(fā)現(xiàn)過程不對,那就退回去繼續(xù)改。

 

但這顯然是一條窄路。這條路冷門到什么程度?在整個AI版圖里,形式化驗證幾乎是邊緣中的邊緣,全球的商業(yè)化玩家一只手就數(shù)得過來。

 

顯然她并不是因為形式化驗證是下一個風口才選的,而是因為她對“困難”的定義和別人不一樣。

 

奧賽就像持續(xù)釋放多巴胺的快感,而研究型數(shù)學像在撞墻,充滿痛苦與煎熬。我其實特別喜歡這種挑戰(zhàn)感?!彼@樣解釋自己癡迷數(shù)學的原因。

 

正是這種刻在骨子里的挑戰(zhàn)欲,讓她不愿再停留在學術研究的舒適區(qū),渴望在更廣闊的戰(zhàn)場上去攻克AI領域的硬骨頭。

 

2024年深秋,斯坦福附近的一家咖啡館里,洪樂潼與當時Meta AI研究總監(jiān)Shubho Sengupta聊了整整幾個小時,核心議題只有一個:AI能不能真正學會數(shù)學推理?

 

兩人一拍即合,一個退學,一個辭職,兩人一起創(chuàng)業(yè)。

 

02一支“草根”工程師軍團

 

Axiom只有20多名員工,洪樂潼用了一個詞來形容團隊的氣質:草根工程師精神。

 

但事實上,這支團隊的成員身份一點也不草根,甚至背景堪稱豪華。

 

Axiom第一位成員,正是和她在咖啡館聊了好幾個小時的Meta前員工Shubho Sengupta,如今他的身份是公司的CTO。

 

核心科學家Fran?ois Charton,則是將Transformer架構引入數(shù)學推理領域的先驅人物。他干的活,就是把數(shù)學算式當成一種“語言”輸入進Transformer,試試看Transformer能不能像翻譯句子一樣去翻譯數(shù)學。

 

其他成員約半數(shù)來自Meta AI,另一半則是世界級數(shù)學家與形式化驗證先驅。

 

而最讓外界震驚的一位成員,是57歲的數(shù)學泰斗小野健(Ken Ono)。

 

他是模形式領域的頂尖學者,美國數(shù)學學會前副會長,拿過古根海姆獎、斯隆獎等榮譽。指導過的學生中有十位摩根獎得主。他還曾為美國奧運游泳隊提供數(shù)據(jù)分析,為電影《知無涯者》擔任顧問。

 

這位弗吉尼亞大學終身教授與洪樂潼結緣于麻省理工。彼時大一新生洪樂潼參與了他的數(shù)論項目。師生關系延續(xù)至今,角色卻已不同,2025年底,小野健辭去教職,全職加入Axiom,成為第15號員工。

 

曾拒絕過Google和Meta邀請的小野健,為什么愿意為一個24歲的學生“打工”?

 

“如果我的猜想能被機器在3天內推廣到10個維度,我愿意當一個‘標注工’?!毙∫敖≡_表示,他選擇幫自己的學生打工,不僅因為洪樂潼開出“不設教學、不設行政、100%科研”的合約,更關鍵的是,AI對他的“降維打擊”,讓他感到興奮。

 

一群頂級學者和前Meta成員,這個團隊哪里草根了?

 

洪樂潼的解釋是,草根,代表著始終“空杯”的心態(tài)和堅韌的品質。在創(chuàng)業(yè)這條路上,即使是資深“牛人”,也要從頭學起,不斷自我革新。

 

她自己最喜歡的不是當“精英”,而是做“草根”,做個nobody(小人物),這樣學習的坡度最陡、速度最快。

 

她自己也是“草根精神”的踐行者,在被問到如何帶領團隊時,洪樂潼說:“我其實不太喜歡用帶領這個詞。我希望自己是一個Individual contributor(獨立貢獻者),每個人都是,這是一群志同道合的人在一起做事。”

 

“我們創(chuàng)立Axiom,就是要無限壓縮把好奇心轉化為真理的時間”,在資本驅動的硅谷,洪樂潼的這種純粹性,對于頂尖研究者而言,或許比一份高薪offer更有吸引力。

 

這支不到20人的團隊,在成立后不到一年就交出了一份令人意外的答卷。

 

2025年12月3日,Axiom宣布其核心系統(tǒng)AxiomProver在無人干預的情況下,攻克了困擾數(shù)學界數(shù)十年的兩道埃爾德什難題。

 

同一天,洪樂潼收到了入選“福布斯30歲以下30人”榜單的消息。

 

同月,AxiomProver又在普特南數(shù)學競賽中斬獲滿分,12道題全對。普特南是北美最負盛名的大學生數(shù)學競賽,成績的中位數(shù)常常為零,過去近百年僅有5個人類選手拿到過滿分。

 

Axiom進一步印證了用形式化驗證構建可靠、可核驗、無幻覺的AI,已是行業(yè)明確的重要方向,而 AxiomProver 則在這條路徑上交出了可復現(xiàn)、高難度的實證。

 

03賽道升溫,但挑戰(zhàn)剛剛開始

 

從行業(yè)發(fā)展來看,洪樂潼的選擇正好踩在了技術轉折點上。

 

2024年年底,Meta FAIR和斯坦福大學等多所機構聯(lián)合發(fā)布了一篇立場論文《Formal Mathematical Reasoning: A New Frontier in AI》。

 

論文給出了這樣一個判斷,過去的AI數(shù)學就是喂很多數(shù)學題,再讓模型輸出答案。這就導致數(shù)據(jù)會污染、過程會胡編,AI沒辦法自判斷對錯,并且還很難復現(xiàn)過程。

 

這顯然是路走錯了。就拿乘法口訣表來說,里面寫的是2*3得6,那么你自己也能理解3*2就也得6。這個過程就叫復現(xiàn)。

 

論文主張的是下一步要把證明助手、形式系統(tǒng)、自動驗證真正接進模型里來,讓AI真正懂數(shù)學。

 

 

但這也意味著這條窄路正在變得擁擠。

 

過去十年,AI賽道的主流敘事是“更大參數(shù)、更多數(shù)據(jù)、更快生成”,所有大公司都在這條路上狂奔。洪樂潼選擇的形式化驗證是其中冷門到幾乎沒有競爭的賽道。

 

今年年初,Meta也發(fā)布了半形式化推理技術,讓大語言模型能夠在不執(zhí)行代碼的情況下驗證代碼補丁,準確率高達93%。競品公司Harmonic在今年1月獲得了英偉達投資,估值達14.5億美元,產(chǎn)品已擴展到代碼編寫和芯片設計領域。Theorem、Axiomatic AI、Cajal等一批初創(chuàng)公司,也在近兩年紛紛進入這個賽道。

 

對Axiom而言,挑戰(zhàn)遠不止行業(yè)競爭。

 

最大的挑戰(zhàn)在于商業(yè)模式。洪樂潼最初的設想是將產(chǎn)品服務于對沖基金和量化交易公司,快速解決與資產(chǎn)定價、股市預測相關的復雜數(shù)學問題。

 

但這個藍圖至今仍停留在構想階段。對高頻交易而言,比“正確”更重要的是“足夠快”,毫秒級的延遲可能比一次罕見錯誤帶來更大損失。

 

Axiom的絕對正確性,在追求速度的金融場景中,其實際價值目前仍需要打一個問號。另一個挑戰(zhàn),則在于除了對價格不敏感的航空航天、國防軍工等少數(shù)領域,其他絕大多數(shù)企業(yè)愿意為“絕對正確”支付高溢價嗎?

 

洪樂潼自己也承認這一點:“數(shù)學怎么賺錢?我們從一開始就面臨這個挑戰(zhàn)?!钡J為,“現(xiàn)在,商業(yè)信號已經(jīng)清晰很多,數(shù)學能創(chuàng)造價值,是因為它能自我驗證、自我檢查?!?/p>

 

另一方面,高估值本身也是一把雙刃劍。16億美元的A輪估值意味著,投資人期望的是超高速的增長和明確的退出路徑。

 

Axiom必須在未來一到兩年內證明其技術具備規(guī)?;虡I(yè)化的可能,否則下一輪融資將面臨巨大壓力。與此同時,它需要在巨頭和強勁對手的夾擊中,用更少的資源跑出更快的速度。

 

Axiom的未來,更像是一場理想主義的壓力測試。 從“絕對正確”的技術理想,到“相對經(jīng)濟”的商業(yè)世界,Axiom的挑戰(zhàn),才剛剛開始。

本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉載請在文中注明來源及作者名字。

免責聲明:本文系轉載編輯文章,僅作分享之用。如分享內容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com