決定AI產(chǎn)品存亡的關(guān)鍵:產(chǎn)品經(jīng)理的這一核心決策
不少產(chǎn)品經(jīng)理將精力傾注于功能交互與算法選型,卻忽略了一個更底層的問題:產(chǎn)品設(shè)計(jì)能否產(chǎn)生'有價值的數(shù)據(jù)'?這才是AI產(chǎn)品真正的護(hù)城河所在。
兩款相似AI產(chǎn)品,三年后命運(yùn)迥異
2020年,國內(nèi)幾乎同時出現(xiàn)了兩款A(yù)I智能簡歷助手,暫且稱它們?yōu)锳產(chǎn)品和B產(chǎn)品。
兩款產(chǎn)品起點(diǎn)相近:均為幫助求職者優(yōu)化簡歷、匹配崗位的AI工具,初期用戶量、融資規(guī)模不相上下,背后算法團(tuán)隊(duì)實(shí)力也旗鼓相當(dāng)。
三年后,A產(chǎn)品成為行業(yè)頭部,月活突破百萬,還孵化出招聘SaaS業(yè)務(wù);B產(chǎn)品卻悄然關(guān)閉,幾乎未引起任何關(guān)注。
是A產(chǎn)品的算法更優(yōu)嗎?并非如此,初期兩者均采用同類開源模型。
是A產(chǎn)品更擅長市場推廣嗎?也不是,B產(chǎn)品曾一度比A產(chǎn)品更為激進(jìn)。
核心差異,源于產(chǎn)品設(shè)計(jì)的一個決策。
A產(chǎn)品在設(shè)計(jì)之初就明確:簡歷優(yōu)化工具最具價值的數(shù)據(jù),并非'用戶投遞了多少份簡歷',而是'哪些簡歷修改行為對應(yīng)了后續(xù)的面試邀請'。于是他們將產(chǎn)品設(shè)計(jì)成閉環(huán):用戶投遞簡歷→跟蹤后續(xù)面試結(jié)果→記錄哪些修改帶來正向反饋→反哺推薦模型。
B產(chǎn)品的數(shù)據(jù)埋點(diǎn)邏輯則較為傳統(tǒng):關(guān)注'用戶打開次數(shù)、使用時長、功能點(diǎn)擊率'。這些數(shù)據(jù)能優(yōu)化交互,卻無法讓模型更智能。
A產(chǎn)品積累的是有因果關(guān)系的訓(xùn)練數(shù)據(jù),B產(chǎn)品積累的是無閉環(huán)的行為日志。三年間,這一差距被無限放大。
這個案例讓我意識到:AI產(chǎn)品的競爭,在設(shè)計(jì)階段就已決定勝負(fù)。那個關(guān)鍵變量,便是——數(shù)據(jù)設(shè)計(jì)。

什么是'數(shù)據(jù)設(shè)計(jì)'?多數(shù)PM從未深入思考
'數(shù)據(jù)設(shè)計(jì)'并非數(shù)據(jù)分析、埋點(diǎn)方案或BI報(bào)表。
它指的是:在產(chǎn)品功能設(shè)計(jì)階段,有意識地規(guī)劃該功能將產(chǎn)生何種數(shù)據(jù)、這些數(shù)據(jù)是否具有訓(xùn)練價值、能否形成壁壘。
打個比方,你是廚師要做菜。數(shù)據(jù)分析是'分析菜是否好吃';數(shù)據(jù)埋點(diǎn)是'在廚房裝攝像頭';而數(shù)據(jù)設(shè)計(jì),則是'建廚房前規(guī)劃食材來源、儲存與加工方式'。
多數(shù)PM會做前兩件事,卻很少認(rèn)真對待第三件。
數(shù)據(jù)設(shè)計(jì)有三個核心層次,PM必須清晰思考:
第一層:數(shù)據(jù)從何而來(數(shù)據(jù)入口設(shè)計(jì)) 產(chǎn)品功能是否會產(chǎn)生有意義的用戶行為信號?用戶哪些操作能反映真實(shí)需求與判斷?
第二層:數(shù)據(jù)形態(tài)如何(數(shù)據(jù)結(jié)構(gòu)設(shè)計(jì)) 采集的原始數(shù)據(jù)是否具備可訓(xùn)練性?是有標(biāo)簽還是無標(biāo)簽?稀疏還是稠密?
第三層:數(shù)據(jù)流向何處(數(shù)據(jù)流向設(shè)計(jì)) 這些數(shù)據(jù)最終能否回流模型形成反饋?還是僅躺在數(shù)據(jù)庫中閑置?
三層都考慮清楚,才是完整的數(shù)據(jù)設(shè)計(jì)。只做其中一層,是多數(shù)PM的現(xiàn)狀。

三個影響產(chǎn)品命運(yùn)的數(shù)據(jù)設(shè)計(jì)決策
數(shù)據(jù)設(shè)計(jì)并非抽象理念,它體現(xiàn)在產(chǎn)品經(jīng)理日常的功能決策中。以下三個決策點(diǎn),決定了AI產(chǎn)品數(shù)據(jù)壁壘的高度。
決策一:產(chǎn)品是'詢問用戶',還是'讓用戶行動'?
這是數(shù)據(jù)設(shè)計(jì)最根本的分歧點(diǎn)。
'詢問用戶'指通過調(diào)研問卷、評分彈窗、滿意度打分獲取數(shù)據(jù)。這類數(shù)據(jù)看似直接,卻有兩大缺陷:一是用戶表達(dá)與真實(shí)行為常不一致;二是數(shù)據(jù)量少,難以驅(qū)動模型迭代。
'讓用戶行動'則是將數(shù)據(jù)采集嵌入用戶自然操作流程,用戶每一次使用行為本身就是數(shù)據(jù)。
以AI代碼助手為例,GitHub Copilot的數(shù)據(jù)設(shè)計(jì)十分巧妙:不僅關(guān)注'用戶是否接受建議',還追蹤'用戶接受后5分鐘內(nèi)是否修改'。若接受后立即修改,說明建議質(zhì)量低;若直接提交,則質(zhì)量高。這個行為序列為模型提供了精準(zhǔn)的質(zhì)量信號,且用戶無需額外操作。
這便是'讓用戶行動'的精髓:數(shù)據(jù)采集隱藏于用戶價值中,用戶無感知,每一次操作都是高質(zhì)量標(biāo)注。
決策二:設(shè)計(jì)的是'單次反饋',還是'序列反饋'?
很多PM設(shè)計(jì)數(shù)據(jù)采集邏輯時,僅考慮'單次':這次交互好不好,用戶是否滿意。
但AI模型真正需要的是序列信號——用戶行為的前后文關(guān)系。
例如,某AI客服產(chǎn)品僅采集'用戶是否點(diǎn)擊滿意',這是單次反饋。
更聰明的設(shè)計(jì)是采集序列:用戶提問→AI回答→用戶追問(說明未答好)→AI二次回答→用戶結(jié)束對話(說明答好)→整個對話鏈構(gòu)成訓(xùn)練樣本。
前者僅知'結(jié)果',后者還知'哪步出問題'。對模型訓(xùn)練而言,后者價值是前者的數(shù)十倍。
Netflix的推薦系統(tǒng)是經(jīng)典案例。他們發(fā)現(xiàn)'用戶評分'信號較'臟'——反映的是'用戶認(rèn)為應(yīng)該喜歡',而非'真正喜歡'。因此Netflix更依賴'用戶觀看行為序列':暫停位置、次日續(xù)看、中途關(guān)閉等,這些序列信號比評分準(zhǔn)確得多。
單次反饋是一個點(diǎn),序列反饋是一條路。想清楚需要點(diǎn)還是路,決定了能訓(xùn)練出何種模型。
決策三:數(shù)據(jù)是'可積累的',還是'用完即棄的'?
這個決策決定了產(chǎn)品是否有時間維度的競爭優(yōu)勢。
可積累數(shù)據(jù)指隨時間推移價值持續(xù)增長的數(shù)據(jù),如用戶歷史行為畫像、專業(yè)領(lǐng)域標(biāo)注語料、長期交互記錄。這類數(shù)據(jù)有'飛輪效應(yīng)'——積累越多,模型越好,產(chǎn)品越好用,用戶越多,數(shù)據(jù)積累越快。
用完即棄數(shù)據(jù)指采集后失去價值的數(shù)據(jù),如實(shí)時流量數(shù)據(jù)、無串聯(lián)的單次會話日志、無標(biāo)簽的原始點(diǎn)擊流。這類數(shù)據(jù)可用于運(yùn)營監(jiān)控,卻無法構(gòu)筑數(shù)據(jù)壁壘。
某醫(yī)療AI公司是反面案例。他們耗費(fèi)大量資源采集數(shù)百萬條患者問診對話,但因未設(shè)計(jì)標(biāo)注體系,這些數(shù)據(jù)全是無標(biāo)簽文本,幾乎無法用于模型精調(diào)。數(shù)百萬條數(shù)據(jù)價值近乎為零,后來花了比采集更多的成本補(bǔ)標(biāo)注,白白浪費(fèi)兩年時間。
采集前需思考:這條數(shù)據(jù)三年后還有價值嗎?若答案不確定,大概率是用完即棄的。

數(shù)據(jù)設(shè)計(jì)失誤的代價:三個真實(shí)案例
僅說正面做法不夠,再看數(shù)據(jù)設(shè)計(jì)失誤的慘重代價。
案例一:某智能寫作工具
因'問錯問題'浪費(fèi)18個月
該產(chǎn)品上線后設(shè)計(jì)了'用戶評分體系':AI生成內(nèi)容后彈出1-5星評分。他們用這些評分訓(xùn)練模型18個月,產(chǎn)品質(zhì)量卻幾乎無提升。
原因很簡單:用戶打分依據(jù)的是'內(nèi)容與期待的接近度',但用戶往往說不清期待,評分高度隨機(jī)。更糟的是,評分彈窗影響體驗(yàn),大量用戶跳過,導(dǎo)致數(shù)據(jù)存在嚴(yán)重選擇性偏差——只有極端滿意或不滿的用戶才打分。
他們問錯了問題,采集到的是噪音而非信號。
后來轉(zhuǎn)而追蹤'用戶對生成內(nèi)容的具體修改行為',三個月后模型質(zhì)量顯著提升。
案例二:某AI教育平臺
以'完課率'為核心數(shù)據(jù),越優(yōu)化越糟
該平臺用AI推薦學(xué)習(xí)路徑,核心優(yōu)化目標(biāo)是'完課率'(用戶完成課程的比例)??此坪侠恚瑔栴}卻隨之而來:模型為優(yōu)化完課率,開始推薦最簡單的課程——因?yàn)楹唵握n程完成率高。結(jié)果用戶雖都完課,但學(xué)的是無挑戰(zhàn)性內(nèi)容,學(xué)習(xí)效果極差,很快流失。
他們采集了正確數(shù)據(jù),卻優(yōu)化了錯誤目標(biāo)。數(shù)據(jù)設(shè)計(jì)不僅要設(shè)計(jì)'采集什么',還要設(shè)計(jì)'優(yōu)化什么'——這兩個問題必須同時想清楚。
案例三:某AI助手產(chǎn)品
數(shù)據(jù)被競爭對手'白嫖'
這個案例特殊卻發(fā)人深省。某AI助手因產(chǎn)品開放,用戶反饋數(shù)據(jù)(包括對話日志)通過API大量流出,被競爭對手用于訓(xùn)練模型。等他們意識到問題時,競爭對手已用其數(shù)據(jù)完成一輪模型迭代。
數(shù)據(jù)設(shè)計(jì)還包括數(shù)據(jù)保護(hù)設(shè)計(jì)。辛苦采集的高質(zhì)量數(shù)據(jù),若無良好訪問控制,可能成為競爭對手的免費(fèi)訓(xùn)練集。

PM如何在日常工作中培養(yǎng)數(shù)據(jù)設(shè)計(jì)能力?
說了這么多理論與案例,最后回到實(shí)際問題:作為產(chǎn)品經(jīng)理,該怎么做?
第一步:
每次需求評審時,加入'數(shù)據(jù)維度'的靈魂發(fā)問。
評審新功能時,強(qiáng)制自己問三個問題:
'這個功能上線后,會產(chǎn)生什么數(shù)據(jù)?'
'這些數(shù)據(jù)能否用于訓(xùn)練或優(yōu)化模型?'
'若不能,能否調(diào)整設(shè)計(jì)讓它產(chǎn)生更有價值的數(shù)據(jù)?'
將這三個問題作為需求文檔的標(biāo)配章節(jié),初期可能覺得多余,但堅(jiān)持三個月,對數(shù)據(jù)的直覺會發(fā)生質(zhì)變。
第二步:
學(xué)會區(qū)分'行為數(shù)據(jù)'與'偏好數(shù)據(jù)',優(yōu)先設(shè)計(jì)前者。
行為數(shù)據(jù)是用戶'做了什么'——點(diǎn)擊、修改、停留、復(fù)購;偏好數(shù)據(jù)是用戶'說喜歡什么'——評分、問卷、標(biāo)簽選擇。
絕大多數(shù)情況下,行為數(shù)據(jù)比偏好數(shù)據(jù)更可靠、更具訓(xùn)練價值。功能設(shè)計(jì)時,優(yōu)先思考'如何讓用戶自然行為成為數(shù)據(jù)',而非'如何讓用戶主動告知偏好'。
第三步:
建立'數(shù)據(jù)價值地圖',定期復(fù)盤產(chǎn)品采集內(nèi)容。
每三個月畫一張表格:列出產(chǎn)品正在采集的所有數(shù)據(jù)類型,評估每類數(shù)據(jù)的'訓(xùn)練價值'(高/中/低)和'積累趨勢'(增長/平穩(wěn)/衰減)。
這張表會帶來意外發(fā)現(xiàn):有些數(shù)據(jù)采集成本高但訓(xùn)練價值低;有些數(shù)據(jù)易獲取卻未被利用。定期復(fù)盤是提升數(shù)據(jù)設(shè)計(jì)能力的最快路徑之一。

產(chǎn)品經(jīng)理:AI產(chǎn)品數(shù)據(jù)戰(zhàn)爭的第一決策人
我在做AI產(chǎn)品的幾年里,見過太多團(tuán)隊(duì)精力用錯地方:花數(shù)月選算法框架,花大價錢買算力,開無數(shù)會議討論模型架構(gòu)——卻從未認(rèn)真思考:產(chǎn)品在產(chǎn)生什么樣的數(shù)據(jù)?這些數(shù)據(jù)能否讓產(chǎn)品越來越聰明?
算法工程師可選擇更好的模型,數(shù)據(jù)工程師可優(yōu)化數(shù)據(jù)管道,但只有產(chǎn)品經(jīng)理能在設(shè)計(jì)階段決定產(chǎn)品能否采集到有價值的數(shù)據(jù)。
這是只有PM能做、也必須做好的決策。
AI產(chǎn)品的競爭,本質(zhì)是數(shù)據(jù)的競爭。而數(shù)據(jù)的競爭,在產(chǎn)品經(jīng)理畫第一張?jiān)蛨D時就已開始。
本文來自微信公眾號“人人都是產(chǎn)品經(jīng)理”(ID:woshipm),作者:吳知,36氪經(jīng)授權(quán)發(fā)布。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com



