欧美三级电影完整|亚洲一二三四久久|性爱视频精品一区二区免费在线观看|国产精品啪啪视频|婷婷六月综合操人妻视频网站|99爱免费视频在线观看|美女一级片在线观看|北京熟女88av|免费看黄色A级电影|欧美黄色毛片儿

<li id="bb3wb"></li>

<ul id="94ei8"></ul>

Meta華人團(tuán)隊(duì)打造新模型Muse Spark：從一張截圖復(fù)刻豆包App看AI新突破

04-10 06:39

Meta超級(jí)智能實(shí)驗(yàn)室（MSL）交出首份答卷，其打造的原生多模態(tài)推理模型Muse Spark（內(nèi)部代號(hào)牛油果）正式亮相。

Meta的“牛油果”模型，終于迎來(lái)成熟時(shí)刻！

智東西4月9日消息，成立9個(gè)月的Meta超級(jí)智能實(shí)驗(yàn)室（MSL）發(fā)布首款模型——Muse Spark（內(nèi)部代號(hào)牛油果）。這是一款支持工具使用、視覺(jué)思維鏈與多智能體編排的原生多模態(tài)推理模型。

在大模型測(cè)評(píng)平臺(tái)Artificial Analysis上，Muse Spark的智能指數(shù)從Llama 4 Maverick的18分躍升至52分，介于Claude Sonnet 4.6與Claude Opus 4.6之間，成功躋身行業(yè)第一梯隊(duì)。

我們第一時(shí)間體驗(yàn)該模型，上傳豆包App截圖并要求復(fù)刻?？梢钥吹剑琈use Spark的回復(fù)風(fēng)格偏口語(yǔ)化，甚至帶有“豆包味兒”，這或許與其面向C端用戶的定位有關(guān)。

Muse Spark生成速度快、效果出色，基本實(shí)現(xiàn)了豆包頁(yè)面的1:1復(fù)刻，連圖像細(xì)節(jié)都精準(zhǔn)還原。

Muse Spark還通過(guò)了小球彈跳測(cè)試。有網(wǎng)友感慨，時(shí)隔1年多，Meta終于推出了能通過(guò)六邊形小球彈跳測(cè)試的大模型，這一時(shí)刻值得記錄。

Muse Spark是ScaleAI創(chuàng)始人、Meta首席AI官汪滔（Alexandr Wang）加入Meta 10個(gè)月后交出的首份答卷。

這一成果來(lái)之不易。此前Llama 4遭遇重大挫折后，Meta對(duì)AI團(tuán)隊(duì)進(jìn)行了大刀闊斧的重組，唱衰大語(yǔ)言模型的楊立昆最終離開(kāi)。

汪滔表示，Meta在過(guò)去9個(gè)月從零搭建全新AI技術(shù)棧，基礎(chǔ)設(shè)施、架構(gòu)、數(shù)據(jù)管線均為全新打造，Muse Spark正是這些努力的結(jié)晶。

不少加入Meta的華人AI專家紛紛轉(zhuǎn)發(fā)這一成果，包括趙晟佳、畢樹(shù)超、余家輝、Jason Wei等。值得注意的是，MSL團(tuán)隊(duì)華人占比很高，從領(lǐng)導(dǎo)到基層員工，許多都是華人面孔。

據(jù)Top華人科創(chuàng)社報(bào)道，Meta還迎來(lái)了新的華人大?！拔浵伡瘓F(tuán)RL實(shí)驗(yàn)室首席科學(xué)家吳翼加盟Meta MSL，直接向Meta副總裁、MSL聯(lián)合負(fù)責(zé)人Nat Friedman匯報(bào)。

Muse Spark是MSL Muse系列的首款模型，未來(lái)還將發(fā)布更多同系列產(chǎn)品。目前該模型已逐步推送至Meta旗下應(yīng)用及Meta.ai網(wǎng)頁(yè)端，但仍有用戶反映使用的仍是Llama 3。

值得注意的是，相關(guān)博客中未提及“開(kāi)源”二字。

體驗(yàn)鏈接：meta.ai

01.多模態(tài)與醫(yī)療健康表現(xiàn)亮眼，智能體及編程工作流待提升

從基準(zhǔn)測(cè)試結(jié)果看，Muse Spark在多模態(tài)感知、推理、醫(yī)療健康及智能體等領(lǐng)域表現(xiàn)處于行業(yè)第一梯隊(duì)。不過(guò)MSL也承認(rèn)，該模型在長(zhǎng)程智能體系統(tǒng)和編程工作流方面仍有提升空間。

以下是Muse Spark的完整基準(zhǔn)測(cè)試成績(jī)。需注意的是，Meta采用的部分?jǐn)?shù)據(jù)呈現(xiàn)方式存在“圖表誤導(dǎo)”嫌疑：乍看之下Muse Spark所有成績(jī)均標(biāo)藍(lán)，似乎全面領(lǐng)先，但實(shí)際上在圖中20項(xiàng)基準(zhǔn)測(cè)試?yán)铮?strong>僅4項(xiàng)拿到SOTA（ state-of-the-art，最先進(jìn)）。

在多模態(tài)能力維度，Muse Spark競(jìng)爭(zhēng)力較強(qiáng)，在美國(guó)大模型領(lǐng)域未被拉開(kāi)明顯代差，基本與GPT-5.4處于同一水平，符合其原生多模態(tài)大模型的定位。

作為將部署于Meta旗下眾多社交媒體、面向廣大個(gè)人用戶的模型，Muse Spark在用戶高度關(guān)注的醫(yī)療健康領(lǐng)域表現(xiàn)不俗，在HealthBench Hard與MedXpertQA（多模態(tài)）兩項(xiàng)評(píng)測(cè)中均斬獲SOTA，顯然經(jīng)過(guò)重點(diǎn)優(yōu)化。

Muse Spark此次還推出了“沉思模式（Contemplating mode）”，可協(xié)調(diào)多個(gè)智能體并行推理，使其能與Gemini Deep Think、GPT Pro等前沿模型的極限推理模式相媲美。

開(kāi)啟“沉思模式”后，Muse Spark在復(fù)雜任務(wù)中的能力顯著提升，例如在HLE“人類最后的考試”基準(zhǔn)測(cè)試中正確率達(dá)58%，在“前沿科學(xué)研究”基準(zhǔn)測(cè)試中正確率為38%。

02.算力需求較Llama 4降一個(gè)量級(jí)，采用新型強(qiáng)化學(xué)習(xí)技術(shù)

除跑分外，該模型的新定位及背后技術(shù)也值得關(guān)注。

Meta表示，Muse Spark是邁向個(gè)人超級(jí)智能的第一步，能理解用戶所處世界，多模態(tài)能力與醫(yī)療健康是當(dāng)前兩大重點(diǎn)方向。

Muse Spark從底層架構(gòu)整合了跨領(lǐng)域和工具的視覺(jué)信息，在識(shí)別、定位方面能力突出，結(jié)合這些功能可實(shí)現(xiàn)多種交互式體驗(yàn)。

例如，用戶上傳游戲畫(huà)面截圖后，可讓Muse Spark將其轉(zhuǎn)化為可互動(dòng)的游戲。

或是告知Muse Spark自己有高膽固醇問(wèn)題，讓其基于多模態(tài)能力和醫(yī)療知識(shí)制作動(dòng)態(tài)食物推薦頁(yè)面。

Meta博客分享的demo僅涉及多模態(tài)和醫(yī)療健康領(lǐng)域，這或許意味著Muse系列模型最終將服務(wù)于扎克伯格的個(gè)人超級(jí)智能愿景，而非單純追求智能上限。

技術(shù)層面，MSL大幅提升了算力利用率：與此前的Llama 4 Maverick相比，Muse Spark用少一個(gè)數(shù)量級(jí)以上的計(jì)算資源就能達(dá)到相同性能。

同時(shí)，MSL在強(qiáng)化學(xué)習(xí)階段采用了新技術(shù)棧，實(shí)現(xiàn)了大規(guī)模強(qiáng)化學(xué)習(xí)中平穩(wěn)、可預(yù)測(cè)的性能提升。

03.實(shí)測(cè)：精準(zhǔn)識(shí)別食物熱量，為Meta AI眼鏡設(shè)計(jì)新品

Muse Spark發(fā)布后，我們進(jìn)行了更多實(shí)測(cè)。

其多模態(tài)能力表現(xiàn)出色：上傳啤酒瓶照片后，Muse Spark準(zhǔn)確識(shí)別出品牌、容量，甚至原圖中肉眼難辨的酒精度。

熱量分析來(lái)自搜索，還將熱量換算成日常食物，并給出消耗對(duì)應(yīng)熱量所需的運(yùn)動(dòng)量，實(shí)用性較強(qiáng)。

我們讓Muse Spark為Meta AI眼鏡設(shè)計(jì)宣傳網(wǎng)頁(yè)（未提供參考）。過(guò)程中，它主動(dòng)調(diào)用AI生圖模型生成產(chǎn)品圖片，再編寫(xiě)完整頁(yè)面代碼，耗時(shí)約2分鐘，效果如下：

該網(wǎng)頁(yè)完成度高，直接設(shè)計(jì)出搭載Muse Spark的Meta AI眼鏡新品。模型還自評(píng)稱，這是旗艦級(jí)官網(wǎng)，按Apple Vision Pro發(fā)布會(huì)標(biāo)準(zhǔn)制作，而非普通落地頁(yè)。

Muse Spark還可用于購(gòu)物推薦：我們讓它搜索汽車(chē)雨刮器，幾秒內(nèi)就給出多個(gè)選項(xiàng)，包含每款產(chǎn)品的優(yōu)劣勢(shì)分析及最終購(gòu)買(mǎi)建議。

04.結(jié)語(yǔ)：“牛油果”成熟，但個(gè)人超級(jí)智能仍需時(shí)間

作為Meta超級(jí)智能實(shí)驗(yàn)室的首秀，Muse Spark已展現(xiàn)出第一梯隊(duì)的水準(zhǔn)，讓人對(duì)Muse系列后續(xù)產(chǎn)品充滿期待。

不過(guò)，扎克伯格所期待的“個(gè)人超級(jí)智能”，目前仍停留在醫(yī)療健康問(wèn)答、網(wǎng)頁(yè)復(fù)刻、購(gòu)物推薦等相對(duì)可控的場(chǎng)景。要真正改變數(shù)億用戶的交互方式，還有很長(zhǎng)的路要走。

本文來(lái)自微信公眾號(hào)“智東西”（ID：zhidxcom），作者：陳駿達(dá)，編輯：云鵬，36氪經(jīng)授權(quán)發(fā)布。

本文僅代表作者觀點(diǎn)，版權(quán)歸原創(chuàng)者所有，如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明：本文系轉(zhuǎn)載編輯文章，僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布，請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

寧德攜手紫金老將，能否抗衡王傳福的家族礦局？

11萬(wàn)里程兌換護(hù)膚品疑為假貨南航客服竟要求刪帖才退里程

存儲(chǔ)漲價(jià)下的消費(fèi)變遷：從科技編輯到電腦店老板，大家都在調(diào)整策略

學(xué)音堂：標(biāo)準(zhǔn)化線上課程破解成人聲樂(lè)學(xué)習(xí)難題

巨虧234億！“中國(guó)巴菲特”致歉，復(fù)星的“財(cái)務(wù)大洗澡”與轉(zhuǎn)型陣痛

<p id="ozbgq"><tbody id="ozbgq"></tbody></p>

<style id="ozbgq"></style>

<menu id="ozbgq"></menu>