GPT-5.5深夜發(fā)布:當(dāng)下最強(qiáng)AI的實(shí)力與局限,人類如何應(yīng)對(duì)?
昨晚我就預(yù)感OpenAI可能要放大招,果然半夜如廁時(shí)刷手機(jī)看到GPT-5.5發(fā)布,瞬間睡意全無(wú)。
過(guò)去一周全球頂級(jí)AI公司模型連發(fā),讓人應(yīng)接不暇,人類的智力空間似乎在不斷縮小。

目前GPT-5.5已在ChatGPT和Codex上線,但僅限Plus以上會(huì)員使用,每月至少需支付20美金才能體驗(yàn)這款當(dāng)下可能最強(qiáng)的AI模型。
我第一時(shí)間體驗(yàn)后,最大感受是它確實(shí)很強(qiáng),卻并非我心中目前最好用的AI。接下來(lái)先聊聊它的優(yōu)勢(shì),再分享幾個(gè)我用GPT-5.5完成的案例。
OpenAI官網(wǎng)介紹GPT-5.5時(shí),用了“A new class of intelligence for real work”這句話。

這顯然是在強(qiáng)調(diào)它是專為解決實(shí)際工作問(wèn)題打造的新一代智能模型。通俗來(lái)講,就是GPT-5.5完成工作任務(wù)的效率更高,成本卻更低。
先看官方發(fā)布的多領(lǐng)域測(cè)試榜單,涵蓋日常工作、科研、工具使用等多個(gè)方面。重點(diǎn)關(guān)注GPT-5.5與Claude Opus 4.7的巔峰對(duì)決。

從榜單可見(jiàn),GPT-5.5基本完勝Claude。我挑幾個(gè)和普通打工人相關(guān)的測(cè)試來(lái)說(shuō)明它的強(qiáng)大之處。
比如GDPval測(cè)試,模擬AI在44個(gè)職業(yè)領(lǐng)域完成知識(shí)型工作,GPT-5.5得分84.9%。

放到現(xiàn)實(shí)工作場(chǎng)景中,這意味著用它完成各領(lǐng)域知識(shí)型工作的能力更強(qiáng),像產(chǎn)品經(jīng)理分析需求、做競(jìng)品報(bào)告、原型設(shè)計(jì)、數(shù)據(jù)分析,創(chuàng)作者產(chǎn)出內(nèi)容,財(cái)務(wù)分析以及文檔寫作、PPT設(shè)計(jì)等。
再說(shuō)說(shuō)GPT-5.5的編碼能力。為什么各大AI廠商發(fā)布新模型都愛(ài)強(qiáng)調(diào)編碼能力?原因很簡(jiǎn)單,編程能很好地考察模型的問(wèn)題分析、路徑規(guī)劃、方案執(zhí)行能力以及問(wèn)題解決成功率。
過(guò)去有些模型雖能編程,但需要多次人機(jī)互動(dòng)調(diào)教才能完成任務(wù)?,F(xiàn)在的新AI模型追求自我分析、規(guī)劃和執(zhí)行,盡量減少人為干預(yù)。GPT-5.5主打的Agentic Coding正是這個(gè)理念,讓AI自主完成編碼任務(wù)。
官網(wǎng)測(cè)試基準(zhǔn)顯示,5.5版本全面超越之前的5.4版本。

另外,編碼工作是AI付費(fèi)的主流場(chǎng)景之一。GPT-5.5還有個(gè)重要特點(diǎn):完成特定任務(wù)時(shí)Token消耗與5.4持平,但效率和成功率更高。這意味著實(shí)際Token消耗會(huì)減少,因?yàn)檫^(guò)去可能需要多輪會(huì)話才能完成的事,現(xiàn)在一次就能搞定。
GPT-5.5的工具調(diào)用和電腦視覺(jué)化操作能力也是目前最強(qiáng)的。

尤其是電腦視覺(jué)化操作,這是未來(lái)Agent替我們完成實(shí)際工作的重要標(biāo)準(zhǔn)。也就是說(shuō),給OpenClaw或Hermes配上GPT-5.5模型,它們的工作能力會(huì)進(jìn)一步提升。

講完榜單和能力,來(lái)看幾個(gè)案例。OpenAI自己做的案例是上傳參考圖,讓GPT-5.5基于Artemis II任務(wù)的真實(shí)數(shù)據(jù)開(kāi)發(fā)太空軌跡應(yīng)用,展示地球、月球、獵戶座的動(dòng)效軌跡。

提示詞為“Implement this as a new app using webgl and vite using real data from the artemis II mission. Make sure to test the app thoroughly until it is fully functional and looks like the app in the picture. Pay close attention to the rendering of the planets and fly paths. I want to be able to interact with the 3D rendering. Ensure it has realistic orbital mechanics.”
這個(gè)案例的效果相當(dāng)出色。再看我用GPT-5.5做的帶交互效果的高保真原型圖,原始需求就一句話。
提示詞:“設(shè)計(jì)一套關(guān)于健康管理App的高保真原型頁(yè)面,帶交互,產(chǎn)品名字是EasyLife,核心功能包括注冊(cè)、登錄、主頁(yè)、個(gè)人身體數(shù)據(jù)顯示,包括一些圖表等。設(shè)計(jì)風(fēng)格帶圓角,整體簡(jiǎn)潔風(fēng)?!?/p>
注意,需求里既沒(méi)說(shuō)詳細(xì)業(yè)務(wù)邏輯,也沒(méi)描述功能模塊,甚至單一模塊的邏輯都沒(méi)提及。丟給GPT-5.5后,它自主分析、設(shè)計(jì)、執(zhí)行,還寫好了前端代碼。

有個(gè)細(xì)節(jié):原始需求里沒(méi)有“活動(dòng)”和“報(bào)告”模塊,但開(kāi)發(fā)版本默認(rèn)帶了,只是頁(yè)面為空。點(diǎn)擊時(shí)提示頁(yè)面暫未開(kāi)發(fā),我跟它提了一句。

大概一兩分鐘后,它就給出了完整版本??催^(guò)我之前文章的讀者可能有印象,去年減脂時(shí)我用其他AI產(chǎn)品做過(guò)類似App,當(dāng)時(shí)折騰很久效果還不好,現(xiàn)在GPT-5.5的效果已經(jīng)可以直接使用了,關(guān)鍵是基本一兩步就完成,無(wú)需多輪會(huì)話。
回到開(kāi)頭的觀點(diǎn):GPT-5.5確實(shí)很強(qiáng),是目前最強(qiáng)的AI模型,但對(duì)我來(lái)說(shuō)不是最好用的。
原因很簡(jiǎn)單,取決于使用場(chǎng)景和目的,也就是你的工作流是什么。
對(duì)我而言,內(nèi)容創(chuàng)作、產(chǎn)品設(shè)計(jì)、咨詢業(yè)務(wù)是已形成的工作流,我用5個(gè)AI員工實(shí)現(xiàn)了自動(dòng)化,這在昨天的文章里提過(guò)。

但這些工作流里沒(méi)有全能模型能勝任所有工作,所以我會(huì)在不同場(chǎng)景和任務(wù)下讓不同Agent搭配不同模型,就像雇傭不同能力的員工。
比如內(nèi)容輔助創(chuàng)作,目前最強(qiáng)的還是Claude Opus 4.6;Agent事務(wù)處理和本地化操作,主要用GPT-5.4;產(chǎn)品類工作,Claude和GPT表現(xiàn)差不多,但Claude性價(jià)比不高。我也用國(guó)產(chǎn)模型,事務(wù)型工作或AI團(tuán)隊(duì)調(diào)度管理常用Kimi、MiniMax和GLM。
其實(shí)不管用什么模型,核心是有沒(méi)有能讓AI接入的工作流。如果只是用AI查信息、聊天,用什么區(qū)別不大。
現(xiàn)在AI發(fā)展很快,很多人焦慮,但焦慮沒(méi)用,關(guān)鍵是想清楚能用AI做什么。每次打開(kāi)對(duì)話框卻無(wú)所適從,這才是值得深思的。
時(shí)代發(fā)展速度只會(huì)越來(lái)越快,讓人焦慮的不是技術(shù)進(jìn)展,而是跟不上節(jié)奏。核心問(wèn)題在于傳統(tǒng)思維和認(rèn)知受限、信息差存在,以及行動(dòng)能力匱乏。
你們可能發(fā)現(xiàn)我最近更新文章頻率很高,有時(shí)一天兩篇。不是時(shí)間變多了,而是我身處這輪發(fā)展進(jìn)程中,還有了AI團(tuán)隊(duì)。我不想錯(cuò)過(guò),所以投入其中。
剛寫完這篇文章,AI圈又有大事:DeepSeek V4來(lái)了!或許我剛得出的結(jié)論又要被推翻了。
本文來(lái)自微信公眾號(hào)“唐韌”(ID:RyanTang007),作者:唐韌,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com



