欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

<li id="bb3wb"></li>

谷歌推“科研合伙人”模型Gemini 3 Deep Think，月費約1800元，物理奧賽金牌級推理能力

02-14 06:30

谷歌Gemini 3 Deep Think正式發(fā)布，推理能力大幅升級，專為科研與工程任務打造。

2月13日，谷歌推出了Gemini 3 Deep Think推理增強版本，這款“推理模式”產品聚焦科學研究與工程應用場景，致力于拓寬智能系統(tǒng)在復雜任務中的能力范疇。

該版本在Gemini 3架構的基礎上優(yōu)化了推理機制，新增“推理時計算”（Inference-time Compute）功能，能在處理復雜邏輯與系統(tǒng)級問題時開展多步驟推演，同時提升結構一致性驗證及工程任務求解的精準度。

由于Deep Think運行時需調用大量后臺算力資源，谷歌制定了差異化付費規(guī)則：

針對追求高效產出的個人專業(yè)用戶，Deep Think被納入最高級別的Google AI Ultra計劃。訂閱用戶每月需支付249.99美元（約合人民幣1800元），即可享受無限次深度推理權限、30TB超大存儲空間以及最高優(yōu)先級的算力響應服務。

面向開發(fā)者與企業(yè)的API接入則采用按量計費模式：輸入百萬tokens收費2美元，輸出百萬tokens收費12美元。

01 智力基準：從算法奧賽到前沿物理領域全面領先

Gemini 3 Deep Think的技術原型曾在2025年7月的國際數(shù)學奧林匹克競賽（IMO 2025）中嶄露頭角。

當時，該原型在4.5小時的規(guī)定時間內，僅通過純自然語言推理就完成了6道高難度題目中的5道，獲得35分，達到金牌選手水平。與以往需將題目轉化為計算機代碼的AI不同，Deep Think證明了AI可像人類數(shù)學家一樣，直接通過邏輯推演攻克頂級數(shù)學難題。

此次正式發(fā)布的Gemini 3 Deep Think推理增強版本，在延續(xù)頂尖推理能力的基礎上，進一步實現(xiàn)了跨學科應用拓展：

在Codeforces競技編程平臺上，該模型取得3455 Elo的評分，躋身“Legendary Grandmaster”等級。這一評分表明其在復雜算法設計與高難度問題求解方面，已處于全球頂尖選手行列。

在被視為通用人工智能（AGI）檢驗標準的ARC-AGI-2測試中，Deep Think在無網絡環(huán)境下獲得84.6%的創(chuàng)紀錄成績，證明其已擺脫對語料庫的單純依賴，具備真正的少樣本抽象歸納與邏輯發(fā)現(xiàn)能力。

面對更高難度的跨學科挑戰(zhàn)，Deep Think在人類最終考試（Humanity's Last Exam, HLE）（48.4%）與CMT Benchmark（50.5%）中也表現(xiàn)優(yōu)異。

無論是深奧的跨學科悖論還是高階物理推演，該模型都展現(xiàn)出極強的結構一致性與邏輯韌性。

這些亮眼數(shù)據(jù)背后，是Gemini 3 Deep Think推理模式的根本性轉變。

與傳統(tǒng)模型“即時生成”的機制不同，Deep Think引入“推理時計算”模式。在輸出結果前，它會在內部構建并模擬多種解題路徑，進行實時一致性自檢。一旦發(fā)現(xiàn)前提沖突或邏輯斷層，系統(tǒng)會立即回溯邏輯并重組推演鏈條。

這種“慢思考”機制，標志著AI已從“對話工具”升級為“科研合伙人”，能為嚴謹?shù)目茖W研究與復雜工程任務提供更具確定性的智力支持。

02 官方演示：推理模式覆蓋科研與工程全流程

谷歌通過多項演示展示了Deep Think在科研與工程領域的實際應用價值。

數(shù)學家Carbone借助Deep Think審閱專業(yè)數(shù)學論文

在科研場景中，羅格斯大學數(shù)學家Lisa Carbone使用Deep Think審閱一篇高度專業(yè)的數(shù)學論文。

Carbone的研究聚焦高能物理領域，旨在探索連接愛因斯坦引力理論與量子力學的數(shù)學結構。在這個訓練數(shù)據(jù)稀缺的領域，Deep Think發(fā)現(xiàn)了一處細微的邏輯缺陷，而這一問題此前未被同行評審察覺。該模型能將跨文檔信息整合到統(tǒng)一推理網絡中，對公式與結論進行一致性判斷，并生成標注及分析報告供研究者參考。

這意味著AI正從“對話工具”逐步轉變?yōu)椤翱蒲泻匣锶恕保⑼ㄟ^Aletheia（谷歌內部用于數(shù)學探索的專業(yè)智能體架構）等系統(tǒng)，實現(xiàn)從輔助檢索到自主邏輯發(fā)現(xiàn)的跨越。

杜克大學研究人員利用Deep Think優(yōu)化復雜晶體生長制造方法

在杜克大學，Wang Lab團隊借助Deep Think優(yōu)化復雜晶體生長的制造方法，以助力潛在半導體材料的研發(fā)。Deep Think設計出一套可生長厚度超100微米薄膜的實驗方案，達到了以往方法難以實現(xiàn)的精準目標，為材料研發(fā)提供了高效可行的實驗路徑。

工程應用領域中，科學家用Deep Think加速物理組件設計

在工程應用場景下，谷歌Platforms and Devices部門研發(fā)負責人、前Liftware CEO Anupam Pthak使用Deep Think加速物理組件設計。用戶上傳復雜機械結構的手繪草圖后，模型能自動識別空間拓撲關系、幾何約束及關鍵尺寸，并生成可執(zhí)行的建模腳本，支持OpenSCAD與Python格式。

整個過程涵蓋幾何關系解析、尺寸推算、連接關系建模及最終輸出文件生成。在官方演示中，生成的腳本直接驅動3D打印設備，輸出符合設計要求的實物模型。

此外，Deep Think在多文件系統(tǒng)級代碼分析中也表現(xiàn)出色。模型可識別變量引用關系、函數(shù)調用依賴及潛在邊界條件問題，并提供可操作的修改建議。演示強調，該模型能處理復雜工程項目的整體架構，為系統(tǒng)設計與代碼驗證提供可靠參考。

官方演示的亮點在于跨場景統(tǒng)一應用：無論是科研論文分析、材料實驗設計、工程建模，還是復雜代碼系統(tǒng)驗證，Deep Think都能通過同一條推理鏈條完成邏輯推演與結果輸出，為科研和工程任務提供一套高效、統(tǒng)一的智能工具。

03 API與行業(yè)集成：科研與工業(yè)領域深度接入

隨著Deep Think發(fā)布，Gemini API早期訪問計劃（Early Access Program，EAP）同步啟動。企業(yè)與科研機構可將該模型接入內部數(shù)據(jù)庫，用于電路邏輯一致性檢查、數(shù)學推導輔助驗證、實驗數(shù)據(jù)結構分析及軟件系統(tǒng)邊界條件排查。

谷歌表示，將優(yōu)先支持能源建模、新材料研發(fā)和生物醫(yī)藥領域的科研與工業(yè)團隊。

谷歌官方尚未公布完整開放時間表及后續(xù)功能擴展計劃，但通過早期訪問計劃，相關團隊將能率先體驗Deep Think在復雜科研和工程項目中的推理能力。

（特約編譯無忌對本文亦有貢獻）

本文來自“騰訊科技”，作者：蘇揚，36氪經授權發(fā)布。

本文僅代表作者觀點，版權歸原創(chuàng)者所有，如需轉載請在文中注明來源及作者名字。

免責聲明：本文系轉載編輯文章，僅作分享之用。如分享內容、圖片侵犯到您的版權或非授權發(fā)布，請及時與我們聯(lián)系進行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

短劇漫劇何時能擺脫“山寨”困局？

連虧七年終迎轉機：TVB借《新聞女王2》實現(xiàn)扭虧為盈廣告收入兩位數(shù)增長

東北與河南“霸總”老板齊發(fā)福利，累計發(fā)40億紅包引熱議

春節(jié)假期賞櫻指南：上海辰山植物園早櫻品種將次第迎來盛花期

二測PV播放破千萬，網易《遺忘之海》：以隨機性為核的設計巧思與待解之題

項目推薦

康小虎 · 健康小屋

康老板 · 氧療堂