985碩博也難逃?我們竟成AI的人肉標(biāo)注師?
在助力AI成長(zhǎng)、卻可能終結(jié)自身職業(yè)的道路上,人類的內(nèi)卷程度究竟已達(dá)何種境地……
文|謝紅婷
編輯|方婷
AI需要經(jīng)過標(biāo)注的數(shù)據(jù)來更好地理解人類世界,而那些高薪的數(shù)據(jù)標(biāo)注員,正是負(fù)責(zé)這一環(huán)節(jié)的工作者。難道人類中最聰慧的一批年輕人,真的在協(xié)助AI,親手?jǐn)嗨妥约旱奈磥恚?/p>
恰好,作為一名正經(jīng)985畢業(yè)的“過來人”,我親身去面試了這些傳說中月薪過萬的數(shù)據(jù)標(biāo)注崗位,帶大家一探究竟。
請(qǐng)觀看36氪原創(chuàng)視頻
??也歡迎關(guān)注36氪視頻號(hào)??

朝九晚六,不加班不駐場(chǎng)
畢業(yè)即月薪過萬
海投簡(jiǎn)歷后,我在一棟老舊寫字樓里見到了一位招聘負(fù)責(zé)人。她告知我,我應(yīng)聘的崗位是某大廠的外包職位,好處是無需真正進(jìn)入大廠“高壓工作”。
工作時(shí)間朝九晚六,不加班、不駐場(chǎng),難度說大不大、說小不小。

在數(shù)據(jù)標(biāo)注行業(yè)里,拉框、聲紋識(shí)別、教AI分辨貓狗、語音轉(zhuǎn)文字等基礎(chǔ)任務(wù),難度如同“兒童啟蒙”,特點(diǎn)是成本低、需求量大,只要有手就能做。
國(guó)外科技大廠通常將這類工作外包給菲律賓、肯尼亞的從業(yè)者,國(guó)內(nèi)二三線城市也有類似的“零工崗”“AI扶貧崗”。

而需要985、211畢業(yè)生參與的數(shù)據(jù)標(biāo)注項(xiàng)目,則屬于“高階挑戰(zhàn)”級(jí)別。不僅要充當(dāng)AI的“判官”,指出其生成內(nèi)容的不當(dāng)之處,還得在專業(yè)領(lǐng)域內(nèi)絞盡腦汁給AI出題。
問題清晰有條理只是基本要求,而且你出的題目,市面上主流模型最多只能答對(duì)40%——換句話說,你得想辦法難住AI。所有努力都是為了讓AI的回答從40分提升到80分,讓它更理解人類思維模式,變得更聰明。
一位“文生文”項(xiàng)目負(fù)責(zé)人對(duì)這項(xiàng)工作做了更詳細(xì)的解釋:

“我們需要給模型設(shè)定考點(diǎn)或參考答案,答對(duì)就能得分。當(dāng)前大模型的培育主要用check list(結(jié)構(gòu)化評(píng)判標(biāo)注),現(xiàn)在也在向rubric(評(píng)分標(biāo)準(zhǔn))進(jìn)化。如果說check list是60分的參考答案,那rubric可能是80分甚至100分的標(biāo)準(zhǔn)。所以培訓(xùn)期我們會(huì)花大量時(shí)間,專門教大家如何撰寫check list。”
如此復(fù)雜的任務(wù),薪資結(jié)構(gòu)是底薪8000元,績(jī)效最高可達(dá)6000元。大部分人能拿到中間檔的3000元績(jī)效,綜合薪資超1萬元。
說實(shí)話,對(duì)985文科剛畢業(yè)生來說,1萬多的月薪確實(shí)有競(jìng)爭(zhēng)力。負(fù)責(zé)人直接表示我的學(xué)歷符合要求,可以進(jìn)入下一步“試標(biāo)”環(huán)節(jié),通過7-10天的培訓(xùn)考核就能正式入職。

給AI當(dāng)“老師”改作業(yè)
它變聰明了,人卻麻木了
隨后,我們找到了曾在大廠外包數(shù)據(jù)標(biāo)注崗工作半年的淵星深入了解。作為科幻作者,他加入的是小說組。

淵星的主要工作是讓模型寫短篇小說。在特定測(cè)評(píng)項(xiàng)目中,他會(huì)針對(duì)同一指令讓5個(gè)大模型作答,每個(gè)模型能寫一萬字甚至更多,加起來總量達(dá)幾萬字。這些海量?jī)?nèi)容都需要標(biāo)注員仔細(xì)審閱評(píng)估。
看大神寫的網(wǎng)文是一回事,看AI寫的網(wǎng)文完全是另一回事。
這就像老師批改作文,只不過五個(gè)“學(xué)生”都是AI。哪里有語???邏輯結(jié)構(gòu)是否合理?這些標(biāo)簽都得標(biāo)注清楚,還要選出最佳創(chuàng)作,親自給AI示范什么是真正的“人情味”。整個(gè)過程堪稱折磨。
淵星的真實(shí)感受是:AI寫的內(nèi)容大多很糟糕。時(shí)間一長(zhǎng),自己也會(huì)嚴(yán)重消耗,旁人覺得很“AI化”的表達(dá),他坦言已經(jīng)看不出區(qū)別:“至少上班時(shí),我完全沒有創(chuàng)作欲望,每天看AI寫的東西就夠折磨了。”
關(guān)鍵是一番折騰后,到手的錢遠(yuǎn)沒想象中多。

因?yàn)榭?jī)效和標(biāo)注量掛鉤,并非每條數(shù)據(jù)都能通過質(zhì)檢專家和算法工程師的檢驗(yàn)。你覺得AI回答能給80分,質(zhì)檢可能只給60分,數(shù)據(jù)需要返修,標(biāo)注量就很難提上去。
給AI當(dāng)“人肉電池”,消耗遠(yuǎn)超想象。無論985、211學(xué)歷,還是大廠機(jī)會(huì)、AI風(fēng)口這些光鮮標(biāo)簽,都掩蓋不了該崗位處于AI產(chǎn)業(yè)鏈下游的事實(shí)。
在淵星看來,標(biāo)注員無法直接接觸產(chǎn)品和算法。規(guī)則制定、任務(wù)下發(fā)由產(chǎn)品和項(xiàng)目經(jīng)理對(duì)接,再傳達(dá)給標(biāo)注員。他直言:“就像項(xiàng)目經(jīng)理更高貴,標(biāo)注員就低人一等,連和他們同會(huì)議室開會(huì)的資格都沒有?!?/p>
面試我的HR直接說,如果只做標(biāo)注,無非是從一個(gè)項(xiàng)目跳到另一個(gè),沒有晉升空間。但她也認(rèn)為“給AI打螺絲”的說法太悲觀,安慰道:“標(biāo)注員更像老師,模型能否變聰明、給用戶的體驗(yàn)如何,根源都在于數(shù)據(jù)質(zhì)量的好壞?!?/p>
只是對(duì)一線標(biāo)注員而言,“模型變聰明”和自己有沒有關(guān)系,很難感知到。更多人和淵星一樣,覺得自己在做無用功。

每個(gè)人,
都在參與投喂AI的“義務(wù)勞動(dòng)”
在加州工作的研究生Jiayi,從事圖像數(shù)據(jù)標(biāo)注已有一年半,她也有類似困惑。

她表示,目前的工作中,自己完全不知道接觸的數(shù)據(jù)訓(xùn)練會(huì)產(chǎn)生什么后續(xù)影響:不清楚目標(biāo)是什么、服務(wù)于哪臺(tái)機(jī)器,更不覺得能學(xué)到實(shí)用技能。
名校生精心標(biāo)注的數(shù)據(jù),對(duì)AI進(jìn)化而言,就像聚沙成塔中的一粒沙。AI建起了前所未有的高塔,人類奉獻(xiàn)的每粒沙都重要,但身處其中的“沙子”,很難看清自己對(duì)整體的意義。
高質(zhì)量數(shù)據(jù)集是人工智能研究的核心。
被稱為“AI教母”的李飛飛,2009年推出ImageNet數(shù)據(jù)集,包含1500萬張圖片、覆蓋2.2萬個(gè)類別。幫助她完成這一龐大工作量的,是通過亞馬遜眾包平臺(tái)(Mechanical Turk)接單的4.8萬名零工。
對(duì)數(shù)據(jù)質(zhì)量的重視讓AI越來越聰明,給AI當(dāng)“老師”的人也開始被層層篩選,卡學(xué)歷只是開始。數(shù)據(jù)標(biāo)注早已從勞動(dòng)密集型產(chǎn)業(yè),變成門檻不斷抬高的“賽博流水線”。

從一線標(biāo)注員升為項(xiàng)目經(jīng)理的Leon透露,他在某大廠后期的主要工作目標(biāo),是通過自動(dòng)化PE workflow agent,實(shí)現(xiàn)自動(dòng)評(píng)測(cè)或標(biāo)注。
AI正進(jìn)化到能自我訓(xùn)練,在這場(chǎng)轟轟烈烈的硅基進(jìn)化中,哪怕是最昂貴的碳基大腦,或許也注定是完成技術(shù)閉環(huán)的燃料。
實(shí)際上,每個(gè)使用AI的人,都在參與這場(chǎng)投喂AI的“義務(wù)勞動(dòng)”。
你與AI的每一次對(duì)話,都可能成為數(shù)據(jù)標(biāo)注員評(píng)測(cè)和精標(biāo)的素材。AI回應(yīng)你后,你的每一次追問、糾正、選擇,都在告訴它人類真正想要什么。
未來,我們和AI會(huì)互相引導(dǎo)走向怎樣的終局?
沒人知道。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com



