欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

谷歌推“科研合伙人”模型Gemini 3 Deep Think,月費約1800元,物理奧賽金牌級推理能力

02-14 06:30
谷歌Gemini 3 Deep Think正式發(fā)布,推理能力大幅升級,專為科研與工程任務打造。

2月13日,谷歌推出了Gemini 3 Deep Think推理增強版本,這款“推理模式”產品聚焦科學研究與工程應用場景,致力于拓寬智能系統(tǒng)在復雜任務中的能力范疇。


該版本在Gemini 3架構的基礎上優(yōu)化了推理機制,新增“推理時計算”(Inference-time Compute)功能,能在處理復雜邏輯與系統(tǒng)級問題時開展多步驟推演,同時提升結構一致性驗證及工程任務求解的精準度。


由于Deep Think運行時需調用大量后臺算力資源,谷歌制定了差異化付費規(guī)則:


針對追求高效產出的個人專業(yè)用戶,Deep Think被納入最高級別的Google AI Ultra計劃。訂閱用戶每月需支付249.99美元(約合人民幣1800元),即可享受無限次深度推理權限、30TB超大存儲空間以及最高優(yōu)先級的算力響應服務。


面向開發(fā)者與企業(yè)的API接入則采用按量計費模式:輸入百萬tokens收費2美元,輸出百萬tokens收費12美元。


01 智力基準:從算法奧賽到前沿物理領域全面領先


Gemini 3 Deep Think的技術原型曾在2025年7月的國際數(shù)學奧林匹克競賽(IMO 2025)中嶄露頭角。


當時,該原型在4.5小時的規(guī)定時間內,僅通過純自然語言推理就完成了6道高難度題目中的5道,獲得35分,達到金牌選手水平。與以往需將題目轉化為計算機代碼的AI不同,Deep Think證明了AI可像人類數(shù)學家一樣,直接通過邏輯推演攻克頂級數(shù)學難題。



此次正式發(fā)布的Gemini 3 Deep Think推理增強版本,在延續(xù)頂尖推理能力的基礎上,進一步實現(xiàn)了跨學科應用拓展:


在Codeforces競技編程平臺上,該模型取得3455 Elo的評分,躋身“Legendary Grandmaster”等級。這一評分表明其在復雜算法設計與高難度問題求解方面,已處于全球頂尖選手行列。


在被視為通用人工智能(AGI)檢驗標準的ARC-AGI-2測試中,Deep Think在無網絡環(huán)境下獲得84.6%的創(chuàng)紀錄成績,證明其已擺脫對語料庫的單純依賴,具備真正的少樣本抽象歸納與邏輯發(fā)現(xiàn)能力。


面對更高難度的跨學科挑戰(zhàn),Deep Think在人類最終考試(Humanity's Last Exam, HLE)(48.4%)與CMT Benchmark(50.5%)中也表現(xiàn)優(yōu)異。


無論是深奧的跨學科悖論還是高階物理推演,該模型都展現(xiàn)出極強的結構一致性與邏輯韌性。


這些亮眼數(shù)據(jù)背后,是Gemini 3 Deep Think推理模式的根本性轉變。


與傳統(tǒng)模型“即時生成”的機制不同,Deep Think引入“推理時計算”模式。在輸出結果前,它會在內部構建并模擬多種解題路徑,進行實時一致性自檢。一旦發(fā)現(xiàn)前提沖突或邏輯斷層,系統(tǒng)會立即回溯邏輯并重組推演鏈條。


這種“慢思考”機制,標志著AI已從“對話工具”升級為“科研合伙人”,能為嚴謹?shù)目茖W研究與復雜工程任務提供更具確定性的智力支持。


02 官方演示:推理模式覆蓋科研與工程全流程


谷歌通過多項演示展示了Deep Think在科研與工程領域的實際應用價值。



數(shù)學家Carbone借助Deep Think審閱專業(yè)數(shù)學論文


在科研場景中,羅格斯大學數(shù)學家Lisa Carbone使用Deep Think審閱一篇高度專業(yè)的數(shù)學論文。


Carbone的研究聚焦高能物理領域,旨在探索連接愛因斯坦引力理論與量子力學的數(shù)學結構。在這個訓練數(shù)據(jù)稀缺的領域,Deep Think發(fā)現(xiàn)了一處細微的邏輯缺陷,而這一問題此前未被同行評審察覺。該模型能將跨文檔信息整合到統(tǒng)一推理網絡中,對公式與結論進行一致性判斷,并生成標注及分析報告供研究者參考。


這意味著AI正從“對話工具”逐步轉變?yōu)椤翱蒲泻匣锶恕保⑼ㄟ^Aletheia(谷歌內部用于數(shù)學探索的專業(yè)智能體架構)等系統(tǒng),實現(xiàn)從輔助檢索到自主邏輯發(fā)現(xiàn)的跨越。



杜克大學研究人員利用Deep Think優(yōu)化復雜晶體生長制造方法


在杜克大學,Wang Lab團隊借助Deep Think優(yōu)化復雜晶體生長的制造方法,以助力潛在半導體材料的研發(fā)。Deep Think設計出一套可生長厚度超100微米薄膜的實驗方案,達到了以往方法難以實現(xiàn)的精準目標,為材料研發(fā)提供了高效可行的實驗路徑。



工程應用領域中,科學家用Deep Think加速物理組件設計


在工程應用場景下,谷歌Platforms and Devices部門研發(fā)負責人、前Liftware CEO Anupam Pthak使用Deep Think加速物理組件設計。用戶上傳復雜機械結構的手繪草圖后,模型能自動識別空間拓撲關系、幾何約束及關鍵尺寸,并生成可執(zhí)行的建模腳本,支持OpenSCAD與Python格式。


整個過程涵蓋幾何關系解析、尺寸推算、連接關系建模及最終輸出文件生成。在官方演示中,生成的腳本直接驅動3D打印設備,輸出符合設計要求的實物模型。


此外,Deep Think在多文件系統(tǒng)級代碼分析中也表現(xiàn)出色。模型可識別變量引用關系、函數(shù)調用依賴及潛在邊界條件問題,并提供可操作的修改建議。演示強調,該模型能處理復雜工程項目的整體架構,為系統(tǒng)設計與代碼驗證提供可靠參考。


官方演示的亮點在于跨場景統(tǒng)一應用:無論是科研論文分析、材料實驗設計、工程建模,還是復雜代碼系統(tǒng)驗證,Deep Think都能通過同一條推理鏈條完成邏輯推演與結果輸出,為科研和工程任務提供一套高效、統(tǒng)一的智能工具。


03 API與行業(yè)集成:科研與工業(yè)領域深度接入


隨著Deep Think發(fā)布,Gemini API早期訪問計劃(Early Access Program,EAP)同步啟動。企業(yè)與科研機構可將該模型接入內部數(shù)據(jù)庫,用于電路邏輯一致性檢查、數(shù)學推導輔助驗證、實驗數(shù)據(jù)結構分析及軟件系統(tǒng)邊界條件排查。


谷歌表示,將優(yōu)先支持能源建模、新材料研發(fā)和生物醫(yī)藥領域的科研與工業(yè)團隊。


谷歌官方尚未公布完整開放時間表及后續(xù)功能擴展計劃,但通過早期訪問計劃,相關團隊將能率先體驗Deep Think在復雜科研和工程項目中的推理能力。


(特約編譯無忌對本文亦有貢獻)


本文來自“騰訊科技”,作者:蘇揚,36氪經授權發(fā)布。


本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉載請在文中注明來源及作者名字。

免責聲明:本文系轉載編輯文章,僅作分享之用。如分享內容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com