騰訊混元再添強(qiáng)援:95后清華博士龐天宇出任首席科學(xué)家,深耕多模態(tài)強(qiáng)化學(xué)習(xí)
【導(dǎo)讀】OpenAI大神姚順雨加盟騰訊不久,又一位AI青年才俊投身騰訊混元戰(zhàn)隊(duì)!95后清華學(xué)霸龐天宇,已確認(rèn)入職騰訊,出任混元首席研究科學(xué)家,主導(dǎo)多模態(tài)強(qiáng)化學(xué)習(xí)方向。騰訊在大模型領(lǐng)域的人才布局,正邁向新高度。
又一位頂尖AI青年學(xué)者,加入了騰訊的大模型陣營!
近日,據(jù)社交媒體消息,前Sea AI Lab高級研究科學(xué)家、清華大學(xué)博士龐天宇,已正式加入騰訊。

他將擔(dān)任騰訊混元「首席/主任科學(xué)家」(Principal Scientist)。
同時作為技術(shù)負(fù)責(zé)人(Tech Lead),帶領(lǐng)團(tuán)隊(duì)開展多模態(tài)強(qiáng)化學(xué)習(xí)(Multimodal RL)的技術(shù)攻關(guān)。
這是繼OpenAI核心成員姚順雨加入后,騰訊在AI核心人才引入上的又一重要舉措。
若說姚順雨的加入旨在通過System 2思維突破模型「推理(Reasoning)」能力,那么龐天宇的到來,則聚焦于解決模型「交互(Interaction)」難題——讓AI能看懂虛擬與現(xiàn)實(shí)環(huán)境,并做出精準(zhǔn)決策。
這一系列引人注目的人事變動,似乎暗示著騰訊AI戰(zhàn)略已進(jìn)入關(guān)鍵階段:從技術(shù)跟隨轉(zhuǎn)向全面主動進(jìn)攻。
95后頂尖學(xué)霸的科研之路
龐天宇的學(xué)業(yè)經(jīng)歷十分亮眼:2007-2013年就讀于十一學(xué)校直升班及首屆科學(xué)實(shí)驗(yàn)班,憑借高中物理競賽成績保送清華大學(xué)數(shù)理基科班,2017年本科畢業(yè)后直接攻讀清華大學(xué)計(jì)算機(jī)系人工智能專業(yè)博士學(xué)位。
2022年博士畢業(yè)后,他加入新加坡Sea AI Lab擔(dān)任高級研究科學(xué)家。
他的主要研究方向?yàn)榭尚艡C(jī)器學(xué)習(xí)與生成式模型。

2013年進(jìn)入的清華數(shù)理基科班,以課程難度高、數(shù)理基礎(chǔ)訓(xùn)練扎實(shí)聞名,是清華培養(yǎng)學(xué)術(shù)領(lǐng)軍人才的重要基地。
2017年,他獲清華大學(xué)數(shù)學(xué)與物理學(xué)士學(xué)位。
本科畢業(yè)后,龐天宇在清華計(jì)算機(jī)系攻讀博士,師從清華人工智能研究院基礎(chǔ)理論研究中心主任、RealAI首席科學(xué)家朱軍教授。
據(jù)悉,龐天宇大三才接觸AI領(lǐng)域,初期研究便切入當(dāng)時的冷門方向——AI對抗魯棒性,甚至難以找到同行交流。
但讀博期間,他展現(xiàn)出強(qiáng)勁的科研能力:不僅頻繁在ICML、NeurIPS、ICLR等AI頂會發(fā)表論文,還斬獲眾多重量級獎學(xué)金,包括全球僅10個名額的「百度獎學(xué)金」、「微軟學(xué)者獎學(xué)金」、「英偉達(dá)學(xué)術(shù)先鋒獎」,以及WAIC云帆獎、鐘士模獎學(xué)金、CAAI優(yōu)秀博士論文等,履歷十分出色。

博士畢業(yè)后,龐天宇加入新加坡Sea人工智能實(shí)驗(yàn)室(Sea AI Lab)任高級研究科學(xué)家。該實(shí)驗(yàn)室由顏水成等知名學(xué)者領(lǐng)導(dǎo),曾是東南亞頂尖AI研究機(jī)構(gòu)。在此期間,他持續(xù)產(chǎn)出高質(zhì)量論文,積累了豐富的工業(yè)界研究經(jīng)驗(yàn)。
深耕多模態(tài)領(lǐng)域,學(xué)術(shù)影響力顯著
作為青年學(xué)術(shù)領(lǐng)軍者,龐天宇在學(xué)術(shù)界影響力突出。截至目前,他已在頂級會議和期刊發(fā)表70余篇論文,谷歌學(xué)術(shù)引用量超15000次。

他的研究方向聚焦多模態(tài)模型的強(qiáng)化學(xué)習(xí),具體包括生成模型(如Diffusion Models)和理解模型(如VLMs)。在騰訊混元團(tuán)隊(duì),他將作為多模態(tài)強(qiáng)化學(xué)習(xí)技術(shù)負(fù)責(zé)人,重點(diǎn)攻克多模態(tài)生成與理解的對齊問題。這一技術(shù)對騰訊游戲、機(jī)器人等業(yè)務(wù)至關(guān)重要,能讓AI既「會生成」內(nèi)容,又「能理解」環(huán)境并實(shí)現(xiàn)交互。
騰訊AI戰(zhàn)略布局清晰化
隨著姚順雨與龐天宇相繼加入,騰訊AI戰(zhàn)略輪廓愈發(fā)清晰。這已不是過去內(nèi)部「賽馬」、各自為戰(zhàn)的模式,而是頂尖科學(xué)家領(lǐng)銜的集中攻堅(jiān)。
據(jù)報(bào)道,騰訊高層近期內(nèi)部講話提到:希望AI社交新玩法,能重現(xiàn)微信紅包的全民熱潮。
1. 人才策略趨向年輕化
騰訊正改變依賴?yán)吓茖W(xué)術(shù)大牛掛名的模式,轉(zhuǎn)而高薪引進(jìn)90后、95后處于科研黃金期的青年科學(xué)家。無論是96年左右的姚順雨,還是95年的龐天宇,都擁有「清華+海外/頂尖機(jī)構(gòu)」的優(yōu)質(zhì)背景,且在OpenAI、Sea等一線平臺積累了大模型實(shí)戰(zhàn)經(jīng)驗(yàn)。
2. 技術(shù)重心實(shí)現(xiàn)升級
兩位科學(xué)家的研究方向形成互補(bǔ):
·姚順雨(Reasoning/Agent):解決模型「思考方式」問題,推動復(fù)雜任務(wù)規(guī)劃能力提升。
·龐天宇(Multimodal RL):解決模型「交互能力」問題,打通虛擬與現(xiàn)實(shí)的決策壁壘。
3. 組織架構(gòu)迎來變革
近期,騰訊成立AI Infra等新部門,核心科學(xué)家職級大幅提升,可直接向總裁匯報(bào)。這表明騰訊正通過高薪與高決策權(quán)限,彌補(bǔ)起步稍晚的劣勢,集中算力與數(shù)據(jù)資源,在智能體(Agent)和多模態(tài)原生賽道追趕甚至超越行業(yè)領(lǐng)先者。

AI下半場競爭,比拼的不僅是算力,更是對大模型本質(zhì)的理解與定義。在這場較量中,騰訊顯然已做好充分準(zhǔn)備。
參考資料:
https://xhslink.com/m/lGSaMidNL9
本文來自微信公眾號“新智元”,編輯:定慧 KingHZ,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com





