12月9日深夜,智譜開(kāi)源了其核心AI Agent模型AutoGLM,引發(fā)AI圈關(guān)注。
距離AutoGLM第一次出現(xiàn)在公眾視野里,已經(jīng)過(guò)去了111天。AutoGLM是智譜AI開(kāi)發(fā)的跨端通用智能體,通過(guò)自然語(yǔ)言指令自主完成手機(jī)、電腦等設(shè)備的復(fù)雜操作,實(shí)現(xiàn)“一句話搞定任務(wù)”的人機(jī)交互體驗(yàn)。
作為全球一個(gè)具備“Phone Use”能力的AI Agent,AutoGLM核心功能圍繞“自主執(zhí)行”展開(kāi)。它能模擬真人點(diǎn)擊、滑動(dòng)、輸入等動(dòng)作,穩(wěn)定處理外賣點(diǎn)單、機(jī)票預(yù)訂、朋友圈互動(dòng)等數(shù)十步流程,覆蓋50多個(gè)高頻中文應(yīng)用的核心場(chǎng)景,同時(shí)支持跨端協(xié)同(手機(jī)+電腦),例如,手機(jī)發(fā)指令讓電腦自動(dòng)生成PPT、整理數(shù)據(jù),任務(wù)在云端運(yùn)行,不占用本地設(shè)備資源。
2025年8月,AutoGLM 2.0面向公眾開(kāi)放,強(qiáng)調(diào)“執(zhí)行型助手”定位,不再局限于對(duì)話或信息查詢,而是“動(dòng)手”完成任務(wù),比如,辦公場(chǎng)景中從檢索資料到生成視頻、PPT的全流程執(zhí)行,生活場(chǎng)景中跨應(yīng)用預(yù)訂服務(wù)等。
但是,由于三方功能的實(shí)際體驗(yàn)不夠順暢,在實(shí)際體驗(yàn)過(guò)程中,授權(quán)動(dòng)作繁瑣,語(yǔ)義理解易錯(cuò)等方面問(wèn)題,讓AutoGLM的首次亮相并未在C端引發(fā)現(xiàn)象級(jí)傳播。
但其構(gòu)建的新技術(shù)范式仍引發(fā)了行業(yè)震動(dòng)。
智譜官方表示,這一次AutoGLM選擇開(kāi)源,主要基于三方面原因:
一是避免AI手機(jī)能力被少數(shù)廠商壟斷,通過(guò)開(kāi)放技術(shù)底座推動(dòng)行業(yè)共建;
二是保護(hù)用戶隱私,讓數(shù)據(jù)與控制權(quán)完全歸屬使用方,支持私有化部署;
三是共享32個(gè)月的技術(shù)積累,降低Agent開(kāi)發(fā)門(mén)檻。本次開(kāi)源內(nèi)容包含訓(xùn)練好的核心模型、Phone Use能力框架、50+高頻App的Demo及文檔,均以MIT和Apache-2.0許可證開(kāi)放。
據(jù)智譜官方,AutoGLM開(kāi)源的首要意義是對(duì)抗技術(shù)壟斷,將“AI使用手機(jī)”這一核心能力基礎(chǔ)設(shè)施化和民主化。
文檔指出,如果“會(huì)用手機(jī)的AI能力”只掌握在極少數(shù)廠商手中,用戶的手機(jī)將越來(lái)越像“別人家的入口”,開(kāi)發(fā)者的創(chuàng)新也會(huì)受制于人。通過(guò)開(kāi)源,AutoGLM將這項(xiàng)能力變?yōu)樾袠I(yè)可以共同擁有和打磨的公共底座。
開(kāi)源使得任何開(kāi)發(fā)者或團(tuán)隊(duì)都能像使用“積木”一樣,將AutoGLM集成到自己的系統(tǒng)中,或進(jìn)行拆解、重寫(xiě)和改造。這降低了Agent開(kāi)發(fā)的門(mén)檻,可以催生出多樣化的AI原生應(yīng)用、硬件和解決方案,加速Agent生態(tài)的繁榮。
同時(shí),基于Phone Use能力涉及的支付、社交、企業(yè)系統(tǒng)等敏感領(lǐng)域的問(wèn)題,AutoGLM團(tuán)隊(duì)強(qiáng)調(diào),將控制權(quán)交還給用戶,以此解決信任核心問(wèn)題。團(tuán)隊(duì)明確表示,“不希望也不應(yīng)該把這些東西握在自己手里”。
有行業(yè)人士對(duì)作者表示:“AutoGLM開(kāi)源的意義遠(yuǎn)超一個(gè)普通的代碼開(kāi)放項(xiàng)目。它是一次戰(zhàn)略性的生態(tài)卡位和規(guī)則定義,其目標(biāo)是成為未來(lái)AI Agent,尤其是終端通用Agent的基礎(chǔ),就像Android之于移動(dòng)應(yīng)用生態(tài)。”
結(jié)合最近“豆包AI手機(jī)”的熱潮來(lái)看,智譜AutoGLM這次開(kāi)源,也意味著各家公司在智能手機(jī)終端的通用Agent之爭(zhēng),正走上完全不同的道路。
而這兩條路徑,正好與多年之前的安卓與蘋(píng)果之爭(zhēng)十分類似。
從策略目標(biāo)層面來(lái)看,AutoGLM的策略,是成為AI時(shí)代的基礎(chǔ)設(shè)施和公共底座,是一套類似于安卓的軟件開(kāi)發(fā)環(huán)境。而豆包手機(jī)助手的策略,是直接搶占硬件入口,通過(guò)“AI附體手機(jī)”的方式,搶占用戶與數(shù)字世界交互的終端。
從AI能力部署層面來(lái)看,AutoGLM采用“云端智能體”范式,為AI配備專屬的云手機(jī)、云電腦,任務(wù)在云端虛擬設(shè)備中執(zhí)行,不占用、不干擾用戶本地設(shè)備;豆包手機(jī)直接采用“終端具身智能”范式,讓AI直接在用戶真實(shí)的物理手機(jī)上進(jìn)行“模擬點(diǎn)擊”操作,并將AI能力深度集成到手機(jī)硬件和系統(tǒng)層,實(shí)現(xiàn)多任務(wù)并行。
智譜AutoGLM的開(kāi)放模式將訓(xùn)練模型、能力框架等開(kāi)源,將操作執(zhí)行能力封裝為API,供開(kāi)發(fā)者融入各類硬件;而豆包與手機(jī)廠商(中興努比亞)合作,推出專屬硬件,搶占用戶終端,其“模擬點(diǎn)擊、調(diào)度一切”的模式,直接挑戰(zhàn)了微信、淘寶等超級(jí)應(yīng)用的生態(tài)壁壘和用戶入口,因此,引發(fā)了平臺(tái)的“封禁”。
智譜AutoGLM與豆包手機(jī)助手的路線分歧,某種程度上像是傳統(tǒng)意義上軟件與硬件誰(shuí)來(lái)定義誰(shuí)的問(wèn)題,后續(xù)必定還有更多的玩家進(jìn)入這場(chǎng)角力,而智譜AutoGLM這次開(kāi)源,更像是通用AI Agent話語(yǔ)權(quán)之爭(zhēng)的大幕拉開(kāi)的一個(gè)重要信號(hào)。