國(guó)家數(shù)據(jù)局出手 六大行動(dòng)給AI裝上“優(yōu)質(zhì)數(shù)據(jù)引擎”
6月8日,國(guó)家數(shù)據(jù)局印發(fā)《推進(jìn)行業(yè)高質(zhì)量數(shù)據(jù)集建設(shè)行動(dòng)的實(shí)施方案》(下稱《方案》),圍繞行業(yè)高質(zhì)量數(shù)據(jù)集供給、流通、應(yīng)用全鏈條,部署強(qiáng)基擴(kuò)容、標(biāo)注攻堅(jiān)、提質(zhì)增效、應(yīng)用賦能、管理服務(wù)、價(jià)值釋放六大專項(xiàng)行動(dòng),明確到2028年底建成一批覆蓋重點(diǎn)領(lǐng)域、經(jīng)過應(yīng)用驗(yàn)證的行業(yè)高質(zhì)量數(shù)據(jù)集,形成“場(chǎng)景牽引數(shù)據(jù)、數(shù)據(jù)驅(qū)動(dòng)模型、模型賦能應(yīng)用、應(yīng)用創(chuàng)造價(jià)值”的產(chǎn)業(yè)閉環(huán)。北京社科院副研究員王鵬告訴記者,這一方案與近期上線試運(yùn)行的國(guó)家數(shù)據(jù)集管理服務(wù)系統(tǒng)形成“政策+平臺(tái)”雙輪驅(qū)動(dòng),標(biāo)志著我國(guó)高質(zhì)量數(shù)據(jù)集建設(shè)從分散探索進(jìn)入集約化、標(biāo)準(zhǔn)化、產(chǎn)業(yè)化發(fā)展的新階段。
在強(qiáng)基擴(kuò)容行動(dòng)上,《方案》聚焦科學(xué)研究、工業(yè)制造等19個(gè)重點(diǎn)領(lǐng)域,以及低空經(jīng)濟(jì)、具身智能、智能駕駛、智慧海洋、生物制造等創(chuàng)新領(lǐng)域,加快推進(jìn)行業(yè)高質(zhì)量數(shù)據(jù)集建設(shè)。中國(guó)工業(yè)互聯(lián)網(wǎng)研究院院長(zhǎng)魯春叢指出,一個(gè)典型的中等規(guī)模智能工廠,僅人、機(jī)、料、法、環(huán)等各類要素的連接點(diǎn)就多達(dá)1200到1500個(gè)。我國(guó)擁有超過600萬家制造業(yè)企業(yè),這些連接點(diǎn)匯聚起來,每天都在產(chǎn)生著規(guī)模難以估量的、蘊(yùn)含豐富工業(yè)機(jī)理的“數(shù)據(jù)洪流”。但目前對(duì)這些數(shù)據(jù)的開發(fā)利用尚處于初級(jí)階段,潛力遠(yuǎn)未得到釋放。
《方案》明確,強(qiáng)化鏈主單位牽引帶動(dòng)作用,支持鏈主單位以聯(lián)合體等形式推動(dòng)產(chǎn)業(yè)鏈上下游協(xié)同共建和資源整合,持續(xù)擴(kuò)大行業(yè)高質(zhì)量數(shù)據(jù)集供給規(guī)模?!斑@項(xiàng)部署正是破解各行業(yè)數(shù)據(jù)潛力價(jià)值釋放不足的關(guān)鍵舉措?!蓖貔i表示。
數(shù)據(jù)標(biāo)注是將知識(shí)和經(jīng)驗(yàn)注入到訓(xùn)練數(shù)據(jù)的過程,是行業(yè)高質(zhì)量數(shù)據(jù)集建設(shè)不可或缺的關(guān)鍵環(huán)節(jié)。在標(biāo)注攻堅(jiān)行動(dòng)上,《方案》引導(dǎo)數(shù)據(jù)標(biāo)注從“以人為主”向“人機(jī)協(xié)同、專家深度參與”的多層次標(biāo)注模式轉(zhuǎn)變,推動(dòng)數(shù)據(jù)標(biāo)注向?qū)I(yè)化、智能化躍升。這一部署直擊工業(yè)數(shù)據(jù)標(biāo)注痛點(diǎn),魯春叢調(diào)研發(fā)現(xiàn),許多智能化改造項(xiàng)目中,數(shù)據(jù)匯聚、清洗、標(biāo)注、治理等基礎(chǔ)性工作占據(jù)了絕大部分項(xiàng)目投入。
為建設(shè)滿足人工智能就緒(AI-Ready)的高質(zhì)量數(shù)據(jù)集,降低訓(xùn)練推理成本,《方案》提出,實(shí)施提質(zhì)增效行動(dòng),發(fā)揮數(shù)據(jù)合成在數(shù)據(jù)集建設(shè)中的積極作用,利用模型、仿真系統(tǒng)等生成的數(shù)據(jù),解決稀缺場(chǎng)景數(shù)據(jù)集構(gòu)造難、真實(shí)場(chǎng)景數(shù)據(jù)采集成本高等問題。鼓勵(lì)各行業(yè)、各地方與國(guó)家標(biāo)準(zhǔn)聯(lián)動(dòng),推動(dòng)重點(diǎn)行業(yè)領(lǐng)域高質(zhì)量數(shù)據(jù)集標(biāo)準(zhǔn)研制。持續(xù)完善“數(shù)據(jù)質(zhì)量驗(yàn)證+模型應(yīng)用反饋”的測(cè)評(píng)方法,加快建設(shè)覆蓋多行業(yè)、多場(chǎng)景、多模態(tài)的測(cè)評(píng)數(shù)據(jù)集,有效評(píng)估高質(zhì)量數(shù)據(jù)集應(yīng)用效果。
在應(yīng)用賦能行動(dòng)方面,《方案》要求,堅(jiān)持“以模引數(shù)、用數(shù)賦?!?,打造集“數(shù)據(jù)集生產(chǎn)加工和流通利用、支撐模型訓(xùn)練應(yīng)用”于一體的數(shù)據(jù)賦能工場(chǎng),加速人工智能應(yīng)用落地。推動(dòng)形成“場(chǎng)景—數(shù)據(jù)—模型”協(xié)同發(fā)展的良性循環(huán)。發(fā)揮“人工智能+”場(chǎng)景牽引作用,推動(dòng)數(shù)據(jù)供給和場(chǎng)景的精準(zhǔn)匹配,以用促建,以實(shí)際需求吸引更多數(shù)據(jù)資源匯聚,推動(dòng)行業(yè)高質(zhì)量數(shù)據(jù)集有效供給和持續(xù)優(yōu)化。
管理服務(wù)行動(dòng)與價(jià)值釋放行動(dòng)則為數(shù)據(jù)要素流通提供制度保障?!斗桨浮访鞔_落實(shí)數(shù)據(jù)持有權(quán)、使用權(quán)、經(jīng)營(yíng)權(quán)三權(quán)分置制度,建設(shè)“物理分散、邏輯集中”的國(guó)家數(shù)據(jù)集管理服務(wù)系統(tǒng)。清華大學(xué)法學(xué)院教授申衛(wèi)星表示,數(shù)據(jù)產(chǎn)權(quán)結(jié)構(gòu)性分置遵循“誰投入、誰貢獻(xiàn)、誰受益”的原則,持有權(quán)側(cè)重自主管控,使用權(quán)對(duì)應(yīng)內(nèi)部處理,經(jīng)營(yíng)權(quán)指向?qū)ν饬魍?。將?shù)據(jù)經(jīng)營(yíng)權(quán)與其他權(quán)利分離,有助于在保護(hù)各方權(quán)益的同時(shí),為數(shù)據(jù)價(jià)值釋放預(yù)留空間。在價(jià)值釋放方面,《方案》提出探索以詞元(Token)為基礎(chǔ)的價(jià)值體系。創(chuàng)新商業(yè)模式,推動(dòng)從基礎(chǔ)數(shù)據(jù)包銷售向API調(diào)用、全棧服務(wù)梯次躍升,探索詞元交易等新型交易模式,構(gòu)建以詞元為基礎(chǔ)的可量化、可定價(jià)數(shù)據(jù)價(jià)值體系。同時(shí)鼓勵(lì)探索數(shù)據(jù)集質(zhì)押融資、作價(jià)入股、資產(chǎn)證券化、數(shù)據(jù)信托、數(shù)據(jù)保險(xiǎn)等多元資產(chǎn)化創(chuàng)新模式,拓寬數(shù)據(jù)價(jià)值轉(zhuǎn)化渠道。
本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽碓醇白髡呙帧?/p>
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com





