十年前的今天,AI的「神之一手」如何重塑人類(lèi)認(rèn)知
本文來(lái)自微信公眾號(hào):APPSO,作者:發(fā)現(xiàn)明日產(chǎn)品的,原文標(biāo)題:《十年前的今天,AI用「神之一手」給人類(lèi)上了一課》
今天,距離改變世界的李世石與阿爾法狗(AlphaGo)的對(duì)決,已整整過(guò)去十年。
多年后,李世石在采訪中仍難忘當(dāng)時(shí)的感受:「輸給AI,感覺(jué)整個(gè)世界都塌了?!?/p>
當(dāng)初接受邀請(qǐng)時(shí),他以為這會(huì)是次「好玩」的經(jīng)歷:「好玩的前提是我覺(jué)得會(huì)贏,從未想過(guò)自己會(huì)輸?!?/p>
這份自信并非傲慢。圍棋曾被視為AI難以攻克的最后堡壘——棋盤(pán)局面數(shù)量達(dá)10的170次方,遠(yuǎn)超宇宙原子總數(shù),傳統(tǒng)算法無(wú)法窮舉。
因此,許多專(zhuān)家預(yù)測(cè)AI要戰(zhàn)勝人類(lèi)頂尖棋手至少需十年,可AlphaGo提前實(shí)現(xiàn)了這一突破。

比賽中,第二局第37手成了反復(fù)被提及的細(xì)節(jié)。AlphaGo將棋子落在人類(lèi)職業(yè)棋手幾乎不會(huì)考慮的位置。
現(xiàn)場(chǎng)解說(shuō)一度認(rèn)為是失誤,觀眾席棋手們面面相覷。但百余手后,那顆棋子恰處制勝關(guān)鍵位置——其價(jià)值在百步后才顯現(xiàn)。
這便是著名的「第37步」。

今天,DeepMind創(chuàng)始人Demis Hassabis在X平臺(tái)發(fā)文稱(chēng):
十年前,AlphaGo在首爾的傳奇比賽開(kāi)啟了人工智能現(xiàn)代時(shí)代的大幕。著名的「第37步」表明,AI技術(shù)已準(zhǔn)備好應(yīng)對(duì)科學(xué)等領(lǐng)域的現(xiàn)實(shí)問(wèn)題——這些方法激發(fā)的新思路對(duì)構(gòu)建通用人工智能(AGI)至關(guān)重要。
「第37步」也成了流傳至今的隱喻:代表看似不合理卻最終正確的決策,代表超出人類(lèi)直覺(jué)邊界的創(chuàng)新,也代表系統(tǒng)或競(jìng)爭(zhēng)中改變局面的關(guān)鍵一步。
擊敗人類(lèi)后,更強(qiáng)的AI進(jìn)一步「去人味」
「我沒(méi)辦法再享受?chē)澹酝艘哿??!?/p>
與AlphaGo對(duì)戰(zhàn)三年后,李世石正式退役。對(duì)5歲學(xué)棋的他而言,圍棋不僅是競(jìng)賽,更是藝術(shù),是棋手個(gè)性與風(fēng)格的延伸。但在AI時(shí)代,它淪為效率游戲。
更讓他難釋?xiě)训氖?,AI持續(xù)進(jìn)化且越來(lái)越「去人化」。
2017年,DeepMind發(fā)布AlphaGo Zero。AlphaGo依賴(lài)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)人類(lèi)高手3000多萬(wàn)手棋譜;而AlphaGo Zero徹底拋棄人類(lèi)經(jīng)驗(yàn),不接觸任何棋譜,僅靠自我對(duì)弈從零生長(zhǎng),三天后便以100:0擊敗AlphaGo。
《大西洋月刊》稱(chēng)其為「不需要從人類(lèi)身上學(xué)習(xí)任何東西的AI」。
DeepMind并未止步。此后推出的AlphaZero,在無(wú)任何先驗(yàn)知識(shí)的前提下,僅憑規(guī)則數(shù)小時(shí)內(nèi)自學(xué)掌握國(guó)際象棋,不僅擊敗人類(lèi)頂尖棋手,更超越當(dāng)時(shí)最強(qiáng)的專(zhuān)業(yè)象棋程序Stockfish。
象棋已被人類(lèi)和計(jì)算機(jī)研究數(shù)十年,即便如此,AlphaZero仍走出人類(lèi)從未嘗試的新策略。
AlphaGo和AlphaGo Zero的棋譜難以理解,被棋手稱(chēng)為「外星文明投下的神秘指南」。
美國(guó)職業(yè)棋手Michael Redmond2017年表示,人類(lèi)學(xué)圍棋的重要方式是搭建故事:「那是我們溝通的方式,非常人性?!姑鎸?duì)「AI味」棋路,他說(shuō)人類(lèi)棋手很難真正投入:「AlphaGo下棋的方式,總讓人覺(jué)得很非人性?!?/p>
這正是李世石的痛苦所在。圍棋對(duì)他從不只是勝負(fù),而是表達(dá)自我的語(yǔ)言。而「第37步」說(shuō)明,這門(mén)語(yǔ)言里AI已有人類(lèi)讀不懂的章節(jié)。
退役后,李世石執(zhí)迷于AI,開(kāi)設(shè)圍棋學(xué)院、出書(shū)、推出桌游之余,還各地演講:「我算很早面對(duì)AI問(wèn)題,其他人也會(huì)經(jīng)歷,未必有開(kāi)心結(jié)局?!?/p>
對(duì)他而言,AI最讓人擔(dān)憂(yōu)的是可能改變?nèi)祟?lèi)價(jià)值觀:「過(guò)去人們敬畏創(chuàng)造力、原創(chuàng)性和創(chuàng)新,AI出現(xiàn)后這些很多已消失?!?/p>
人機(jī)共創(chuàng)時(shí)代
并非所有人都認(rèn)同這一說(shuō)法。
「AI毀滅了圍棋圈所有秩序,然后重建?!箍的螤柎髮W(xué)研究AI的圍棋愛(ài)好者Jiuheng He如此描述。
香港一家圍棋學(xué)院里,老師Ng Chee Man為學(xué)生提供iPad輔助學(xué)習(xí)——每次落子,AI實(shí)時(shí)給出「最佳走法」建議,記錄優(yōu)劣。這種訓(xùn)練方式成了全球圍棋學(xué)院的標(biāo)配。
數(shù)據(jù)印證了轉(zhuǎn)變。2023年《美國(guó)國(guó)家科學(xué)院院刊》發(fā)表的研究以1950至2021年580萬(wàn)手棋譜為基礎(chǔ),結(jié)論振奮:AlphaGo擊敗李世石前,人類(lèi)棋手判斷質(zhì)量66年幾乎無(wú)變化;2016、2017年起,這一數(shù)字明顯攀升。
換言之,人類(lèi)贏不了AI,但因AI變得更強(qiáng)了。
DeepMind首席研究科學(xué)家、AlphaGo項(xiàng)目負(fù)責(zé)人David Silver評(píng)論:
「看到人類(lèi)棋手快速適應(yīng),將新走法融入自己的方法,非常振奮。這些結(jié)果表明,人類(lèi)將在AI發(fā)現(xiàn)的基礎(chǔ)上,大幅提升自身潛力?!?/p>
事實(shí)上,AlphaGo公開(kāi)亮相前這一規(guī)律已現(xiàn)。曾在不公開(kāi)測(cè)試中對(duì)決AlphaGo的法國(guó)棋手樊麾雖落敗,卻稱(chēng)AlphaGo讓他以全新方式審視圍棋,技術(shù)飛速提升,世界排名躍升。
2017年被AlphaGo擊敗的柯潔,2023年坦言除正式比賽外很少與真人練習(xí)。在他看來(lái),AI成了圍棋創(chuàng)造力的新源頭:
創(chuàng)造性必須投入實(shí)戰(zhàn)檢驗(yàn)?,F(xiàn)在圍棋創(chuàng)新大部分由AI完成,我們想下不同的棋大概率會(huì)輸,因?yàn)锳I通過(guò)大量實(shí)戰(zhàn)得出不同思維——這才是創(chuàng)造力。
這種人機(jī)協(xié)作思維在新生代棋手身上體現(xiàn)徹底。韓國(guó)棋手申真谞,首位00后世界冠軍,棋迷稱(chēng)他「申工智能」,以長(zhǎng)時(shí)間AI訓(xùn)練著稱(chēng)。
他曾在第25屆農(nóng)心杯實(shí)現(xiàn)跨賽季16連勝,超越李昌鎬紀(jì)錄。談及與AI的關(guān)系,他說(shuō):「我和AI現(xiàn)在是朋友。AI和人類(lèi)思路完全不同,它通過(guò)數(shù)學(xué)算法解決問(wèn)題,借鑒其思路讓我受益良多。」
從李世石的崩塌到申真谞的崛起,是同一枚硬幣的兩面:前者是第一代直面沖擊的人,后者是第一代將沖擊化為養(yǎng)分的人?!傅?7步」對(duì)他們意義截然不同。
十年前,「第37步」告訴世界:AI能走出人類(lèi)從未想過(guò)的路。十年后,圍棋這面鏡子告訴我們:真正的問(wèn)題從不是人類(lèi)能否贏AI,而是人類(lèi)如何與它一起,走向連AI也尚未到達(dá)的地方。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com



