AI Agent成了大廠必爭之地。
近期,蘋果、谷歌、Antropic、OpenAI紛紛發(fā)布AI Agent進展 ,希望用大模型技術改變人機交互方式,找到AI最恰當的落地方式。
這其中,國內AI企業(yè)智譜快速布局,領先海外巨頭一個身位。
繼10月25日首次上線可以代替人類操作手機和電腦的AI工具之后,11月29日,智譜發(fā)布了AI Agent系列更新。
主打AI接管手機的AutoGLM,已經可以實現跨APP、跨設備、長流程的復雜步驟。
所謂AutoGLM,是指接收人類簡單語音指令,自動執(zhí)行手機端復雜任務,任務執(zhí)行過程中可以持續(xù)與用戶進行交互反饋。
根據簡單語音指令,AutoGLM可以在微信、小紅書、美團、淘寶、抖音、攜程等APP上執(zhí)行發(fā)布消息、查找店鋪、選購商品、路線導航、訂機票、訂車票、訂酒店等操作。
銀河證券近日發(fā)布研報指出,AI Agent的崛起正重塑AI產業(yè)鏈并帶來投資新機遇,未來,AI Agent模型將改變C端流量入口的分配,或許還會取代APP的地位,并與硬件爭奪流量入口。
智譜CEO張鵬演示了“AI發(fā)給人類的第一個紅包”,他發(fā)出“面對面建群并發(fā)布200個紅包”的語音指令之后,AutoGLM自動執(zhí)行了打開微信、建群、發(fā)群紅包的系列步驟。
當然,輸入密碼還是需要人類確認的。
據介紹,AutoGLM可以實現觸控執(zhí)行、內容理解、內容生成等大類別任務。
目前,AutoGLM覆蓋了手機端主流生活場景APP,包括微信、小紅書、抖音、微博、美團、大眾點評、餓了么、淘寶、京東、拼多多、高德地圖、百度地圖、12306、攜程、去哪兒等。
另外,針對特殊場景,也可以實現跨APP操作。
比如,“在小紅書上搜索北京比較正宗的餐廳,找一家合適的在大眾點評上定位,并在微信上發(fā)送給老婆,告訴我它在美團上有哪些推薦菜,幫我高德導航過去”;“對比攜程和去哪兒下周三從昆明到烏魯木齊的航班價格”。
GLM-PC是面向PC端的自主Agent,目前開放第一階段的內測場景,包括會議替身、文檔處理、網頁搜索與總結、遠程和定時操作、隱形屏幕等。
不過,智譜方面坦陳,由于PC和PC任務的復雜程度,目前大模型的能力距離真正代替用戶辦公還有一定距離。GLM-PC在當前版本下,用戶仍需要輸入非常精準的指令。
大模型正在改變人機交互方式,而AI Agent是行業(yè)內公認的、最具潛力的AI落地方式。
或許,AI Agent可以將移動互聯(lián)網時代的“人適應機器”,推進到AI時代的“讓機器適應人”。
蘋果(Apple Intelligence)、Anthropic(Computer Use)、谷歌(Jarvis)和 OpenAI(Operator)等企業(yè)也已經把Agent作為2025年的業(yè)務重點。
AI Agent能夠讓大模型完全執(zhí)行人類的工作流程,適應、學習、迭代,與其他系統(tǒng)和人類協(xié)作,并端到端地完成任務。
在智譜CEO張鵬看來,現階段,AutoGLM相當于在人與應用之間添加一個執(zhí)行的調度層,大幅改變了人機交互形式。
張鵬認為,大模型發(fā)展會經過五個階段,分別是L1語言能力、L2邏輯能力(多模態(tài)能力)、L3使用工具的能力、 L4自我學習能力、 L5探究科學規(guī)律。
目前,Agent會極大地提升大模型的L3能力,同時開啟對L4自我學習能力的探索。
“而且,Agent可以看作是大模型通用操作系統(tǒng)LLM-OS的雛形,未來有可能實現原生的人機交互?!睆堸i說。
從產業(yè)端來看,AI Agent有廣闊的市場機遇。銀河證券預計,到2028年,中國AI Agent的市場規(guī)模將激增至8520億元,年復合增長率達72.7%。
“AI Agent也會推動APP生態(tài)逐漸向端側生態(tài)轉變,成為AI應用發(fā)展新趨勢?!便y河證券在研報中指出,AI Agent通過實現自然語言與硬件的交互,解決端側AI痛點,可能改變C端流量入口的分配機制。
業(yè)界對此有共識。智譜COO張帆也認為,AI Agent有望革新智能設備的生態(tài),手機+AI會變成隨身個人智能助理,PC+AI有機會成為全新生產力工具,汽車+AI會打開汽車更大的想象空間。