谷歌暗增新功能,Gemini化身執(zhí)行助手,科技巨頭爭相布局AI任務(wù)執(zhí)行
一張截圖提前揭示了今年谷歌I/O大會的重要動向:
Gemini不僅滿足于聊天,更要成為Agent工作臺。
近期,長期關(guān)注谷歌產(chǎn)品動態(tài)的TestingCatalog發(fā)現(xiàn)了Gemini上新增的「Agents」入口。

該入口與Gems、Files并列,位于一級導(dǎo)航欄,并非僅對開發(fā)者開放的隱藏選項(xiàng)。
這一變化傳遞出明確信號:
Gemini的下一階段,將從「問答聊天框」升級為「任務(wù)執(zhí)行工作臺」,用戶下達(dá)任務(wù)后AI可直接執(zhí)行。
梳理谷歌近半年的產(chǎn)品動作,脈絡(luò)清晰可見:
Agent Designer在Gemini Enterprise全面推出,NotebookLM新增音頻生成與視頻摘要功能,Agentspace整體并入Gemini Enterprise成為核心引擎,Chrome瀏覽器嵌入Gemini側(cè)邊欄并上線Auto Browse讓AI代操作。
如今,Gemini聊天界面中出現(xiàn)了與Chat并列的「Agents」標(biāo)簽頁,用戶可直接新建任務(wù)、設(shè)定目標(biāo)、掛載工具和文件,界面更像任務(wù)執(zhí)行平臺而非普通聊天窗口。
每一步都在推進(jìn)同一目標(biāo):將Agent能力從開發(fā)者后臺推向普通用戶。
谷歌I/O大會尚未召開,其戰(zhàn)略布局已顯露雛形。
Chat不再是唯一核心
查看谷歌官方產(chǎn)品描述,風(fēng)格已發(fā)生轉(zhuǎn)變。
2024年2月Gemini for Google Workspace剛上線時,核心賣點(diǎn)是Chat功能。

通過與AI聊天完成寫郵件、做會議紀(jì)要等任務(wù),本質(zhì)是嵌入Workspace的聊天助手。
現(xiàn)在谷歌官網(wǎng)對Gemini Enterprise的描述變?yōu)椋骸窯emini Enterprise讓團(tuán)隊(duì)在安全平臺上發(fā)現(xiàn)、創(chuàng)建、分享和運(yùn)行AI Agent?!?/p>

聊天能力仍是Gemini Enterprise的核心之一,但已被納入更大的Agent平臺框架。

TestingCatalog曝光的Gemini Enterprise測試界面
根據(jù)TestingCatalog曝光的測試界面,Agent已進(jìn)入主交互區(qū):左側(cè)可在Chat與Agent間切換,右側(cè)整合目標(biāo)、Agent、應(yīng)用連接與文件面板。
新增的「智能體」標(biāo)簽頁中,「新建任務(wù)」和「收件箱」是顯眼入口。
啟動新任務(wù)時,界面會擴(kuò)展為功能豐富的任務(wù)工作區(qū)。
核心聊天視圖保留,但右側(cè)新增結(jié)構(gòu)化任務(wù)面板。
該面板清晰定義任務(wù)要素,包括「目標(biāo)」「智能體」「已連接的應(yīng)用」和「文件」。
右側(cè)邊欄還設(shè)有「Require human review」(需要人工審核)開關(guān),用戶可添加人工審核節(jié)點(diǎn),使界面更像任務(wù)執(zhí)行工作區(qū)而非普通聊天窗口。
這意味著打開Gemini不再只是為了聊天,而是為了「運(yùn)行任務(wù)」。
這也印證了Gemini Enterprise的定位已從「聊天助手」轉(zhuǎn)變?yōu)椤窤gent運(yùn)行平臺」。
無需代碼
也能創(chuàng)建Agent
產(chǎn)品層面的關(guān)鍵突破是Agent Designer,已于2025年底正式上線。

谷歌官方定義為:
一個交互式無代碼/低代碼平臺,用于在Gemini Enterprise中創(chuàng)建、管理和發(fā)布單步及多步Agent。
其核心能力包括:
第一,多步驟Agent。
不僅支持「寫郵件」等單次指令,還能編排多步任務(wù),Agent可嵌套子Agent形成工作流。
第二,連接真實(shí)工具。
已上線Gmail、谷歌Drive、Jira、GitHub、Notion、SharePoint等連接器,Shopify等更多工具也進(jìn)入公開預(yù)覽階段。
第三,定時執(zhí)行。
Agent可按設(shè)定時間自動運(yùn)行,無需人工值守。
此前,谷歌通過Agentspace(現(xiàn)已并入Gemini Enterprise)驗(yàn)證了該路線:將知識搜索與Agent執(zhí)行整合到同一平臺。
員工無需關(guān)注后臺運(yùn)行的Agent或數(shù)據(jù)源,在同一界面即可完成搜索、提問和任務(wù)執(zhí)行。
泄露界面中的C端Agent標(biāo)簽頁表明,這些能力不會僅局限于企業(yè)版。
谷歌很可能將其推向所有用戶。
僅有智能還不夠
還需執(zhí)行能力
需明確一個易混淆的概念:
Agent不等于大模型。
大模型是Agent的「大腦」,負(fù)責(zé)理解任務(wù)、推理路徑和生成決策。
但要完成實(shí)際任務(wù),還需「手腳」——編排層,負(fù)責(zé)拆解步驟、調(diào)用工具、銜接上下文和處理執(zhí)行異常。
谷歌此次重點(diǎn)完善的正是這層能力。
從公開資料看,Gemini Enterprise的Agent Designer是面向普通企業(yè)用戶的可視化Agent工作臺:無需代碼,即可編排單步或多步任務(wù)。
相比之下,Vertex AI Agent Builder中的Agent Designer更偏向底層和開發(fā)者場景。
兩者能力框架相似,但前者更易用、門檻更低。
簡言之,谷歌并非單純提升模型的聊天能力,而是將原本面向開發(fā)者的Agent構(gòu)建能力,包裝成普通用戶也能上手的可視化工具。
對C端用戶而言,這意味著無需懂API或Python,通過簡單操作即可讓AI完成工作流。
從「會聊天的AI」到「能干活的AI」,關(guān)鍵就在于這個編排層。
編排層競爭格局
放眼行業(yè),谷歌并非唯一布局編排層的企業(yè)。
Anthropic和OpenAI選擇了截然不同的路線,三家產(chǎn)品差異顯著。
先看理念:
谷歌走平臺化路線。
將Agent能力嵌入現(xiàn)有產(chǎn)品矩陣(Workspace、Search、NotebookLM、谷歌Cloud),依靠分發(fā)優(yōu)勢搶占市場。
邏輯清晰:20億+用戶的觸達(dá)能力是護(hù)城河,Agent功能可直接集成到用戶常用工具中。

Anthropic走工具化路線。
Claude Cowork運(yùn)行在桌面端,可直接操作本地文件、文件夾和應(yīng)用程序。
Anthropic官方產(chǎn)品頁描述:
它能在不同應(yīng)用間自由切換,整合多源信息,無需用戶協(xié)調(diào)即可完成任務(wù)。

https://www.anthropic.com/product/claude-cowork?utm_source=chatgpt.com
不建平臺,不搞生態(tài),讓模型本身成為Agent。
OpenAI則采取平臺與生態(tài)并舉的策略:
一方面通過GPTs和GPT Store擴(kuò)大第三方供給與分發(fā),另一方面在API側(cè)從Assistants API遷移到Responses API,并以Agents SDK支持完整的Agent開發(fā)。
再看架構(gòu)差異:
谷歌重視編排層。
Vertex AI Agent Builder提供完整框架,Agent Designer作為前端,企業(yè)級多Agent協(xié)作是核心賣點(diǎn)。
Anthropic輕編排重能力。
模型原生支持工具調(diào)用和環(huán)境交互,編排工作由開發(fā)者自行完成。Claude的思路是:與其提供框架,不如讓模型足夠強(qiáng)大,支持靈活編排。
OpenAI處于中間位置。
Assistants API提供編排抽象,但不如谷歌厚重;GPT Store負(fù)責(zé)分發(fā),但生態(tài)活躍度存疑。
目標(biāo)用戶也完全不同:
谷歌瞄準(zhǔn)企業(yè)IT部門和C端普通用戶,門檻最低;Anthropic面向開發(fā)者和高級用戶,上限最高;OpenAI試圖覆蓋開發(fā)者和C端用戶。
值得注意的是,三家競爭焦點(diǎn)已從「模型智能度」轉(zhuǎn)向「編排層易用性和生態(tài)豐富度」,這才是決定開發(fā)者選擇的關(guān)鍵。
誰能率先讓十億人用上Agent
當(dāng)前戰(zhàn)場不在模型層。
谷歌CEO Sundar Pichai曾在官方博客中表示:谷歌的競爭力不僅在于單一模型版本,更在于完整的全棧能力——從研究、模型與工具,到觸達(dá)數(shù)十億用戶的產(chǎn)品入口,再到全球云網(wǎng)絡(luò)和數(shù)據(jù)中心體系。

當(dāng)Agent從API走向GUI(圖形用戶界面),「人人可用」的臨界點(diǎn)正在臨近。
在這一臨界點(diǎn)上,分發(fā)能力的重要性正迅速超過模型跑分。
Anthropic的優(yōu)勢在于更早推出「computer use」等原生Agent能力。
Claude已能通過截圖、鼠標(biāo)和鍵盤與桌面環(huán)境交互,Cowork明確強(qiáng)調(diào)其不是聊天助手,而是能在本地文件、文件夾和應(yīng)用間切換、代用戶執(zhí)行多步知識工作的系統(tǒng)。
但Anthropic的短板也很明顯:缺乏谷歌那樣的消費(fèi)級產(chǎn)品矩陣,Cowork目前仍處于research preview階段,雖擴(kuò)張迅速,但距離大規(guī)模默認(rèn)分發(fā)還有差距。
距離谷歌I/O大會不到一個月,谷歌很可能進(jìn)一步公開其Agent戰(zhàn)略。
這更像是一場「分發(fā)對執(zhí)行」的對賭。
谷歌的賭注是:當(dāng)Agent能力接入Gemini、Workspace等產(chǎn)品入口,現(xiàn)成的分發(fā)網(wǎng)絡(luò)將快速完成用戶教育。
Anthropic的賭注是:當(dāng)開發(fā)者和高級用戶體驗(yàn)過能跨應(yīng)用、操作桌面的Agent后,會優(yōu)先為執(zhí)行力買單。
Agent競爭的焦點(diǎn)正從「誰更會聊天」轉(zhuǎn)向「誰更能完成任務(wù)」。
比拼的不僅是Agent的執(zhí)行力,還有誰能最快、最大規(guī)模地將這種能力送達(dá)用戶。
谷歌和Anthropic都在押注Agent,但追求的勝利方式不同。
參考資料:
https://www.testingcatalog.com/google-develops-its-own-desktop-agent-to-compete-with-cowork/
本文來自微信公眾號“新智元”,作者:新智元,編輯:元宇,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com






