去年10月份,智譜發(fā)布了全球首 個phone use產品 AutoGLM,開啟了Agent應用的新時代。今天,智譜再次升級,發(fā)布 AutoGLM 2.0。
AutoGLM 2.0 再次將 Agent 提升到新的高度——
? 這是全球首 個手機 Agent
? 國民級 Agent,真正面向普羅大眾、人人可用
? 開創(chuàng) Agent + 云手機的新技術范式,不用搶占用戶手機和電腦
? 突破硬件限制,能在任何設備、任何場景下運行,幫助用戶Agent代理操作
? 由純國產模型驅動(GLM-4.5、GLM-4.5V),具備推理、代碼與多模態(tài)的全能能力

一、執(zhí)行型助手
過去的 AI 多停留在“對話”層面,只能回答問題;一般的 Agent 助手也多局限于信息查詢和總結。AutoGLM 2.0 則實現了質的飛躍——它不再只是“說”,而是真正能夠“做”。
事實上,在 AutoGLM 1.0 中,智譜已探索過讓 AI 代替用戶完成部分手機操作,但只在有限場景下生效。如今,隨著 AutoGLM 2.0 的發(fā)布,它已經成長為一名 執(zhí)行型助手,能夠在「云端」自主完成多樣化的任務。
在生活場景中,用戶只需一句話,就能讓 AutoGLM 操作抖音、小紅書、美團、京東等 40+ 高頻應用:點外賣、訂機票、查房源、預約健康服務,例如幫你買「秋天的第 一杯奶茶」。
在辦公場景中,它同樣能跨應用執(zhí)行全流程工作:從信息檢索到內容撰寫,再到生成1分鐘短視頻、PPT 或播客,并直接完成小紅書發(fā)布。
這意味著,AI 不再是一個“聊天工具”,而是一個能真正替你干活的全能代理人。它不僅能給出答案,還能把任務完整執(zhí)行,幫助用戶節(jié)省時間與精力,徹底改變人與 AI 的協作方式。
二、為 AI 配一臺手機
AutoGLM 的主要亮點,是一個 APP 讓一部手機成為真正的“新物種”。
在 AutoGLM 2.0 中,智譜為 AI 配備了專屬云手機和云電腦。Agent 可以在云端自主干活、完成任務,而無需占用用戶的本地設備,期間用戶可以使用其它APP(如刷抖音、打游戲)。
這意味著它不僅能“自動駕駛手機”,還可異步“代理辦公”。讓手機真正變成具備自主執(zhí)行、跨端協作能力的「智能體手機」。
AutoGLM 會以這樣的產品形態(tài)出現,源于智譜對 AGI 早期形態(tài)的理解。智譜認為從 Agent 到 AGI,還需要滿足 3A 原則:
? Around-the-clock(全時):24 小時運行,即使用戶離線,Agent 依然在執(zhí)行任務
? Autonomy without interference(自主零干擾):獨立運行,不占用用戶屏幕與算力,平行世界的搭子
? Affinity(全域連接):跳出瀏覽器對話框,跨越手機、電腦、手表、眼鏡、家電等設備,操作物理世界
三、新交互,新生態(tài)
借助 AutoGLM 強大的 云端執(zhí)行能力,人與設備的交互方式正在被重新定義。
智譜已將 AutoGLM 的操作執(zhí)行能力封裝為 API,開發(fā)者只需簡單接入,即可將這一能力無縫融入各類硬件設備。
從 AI 眼鏡等可穿戴設備到傳統家電,AutoGLM 讓它們首次具備完整的 手機級操作能力,無需在端側堆疊復雜系統或大容量電池。例如,可以直接通過智能眼鏡點一杯咖啡。
今日起,AutoGLM 移動端 API 申請通道及 開發(fā)者生態(tài)共建計劃正式上線。除手機與電腦外,手表、眼鏡、家電等設備都能成為 Agent 驅動的智能助手。
智譜期待與更多用戶和開發(fā)者攜手,共同探索 AI 融入物理世界的無限可能。
四、技術SOTA
AutoGLM 得以在國內全量上線,因為它是純國產 Agent,并且成本相較于接入國外模型的 Agent 有了數量級的下降。AutoGLM 由智譜最新開源 SOTA 語言模型 GLM-4.5 與視覺推理模型 GLM-4.5V 驅動。AutoGLM 將基座模型原生能力發(fā)揮到*,并結合在「端到端異步強化學習」方面的多項突破成果,得以完成 推理、編碼、研究、Agentic 與 GUI 操作等多類任務,并可根據需求靈活調用最合適的「大腦」完成執(zhí)行。
? ComputerRL:提出 API-GUI 協同范式,提升數據多樣性與計算效率;改進 GRPO 并提出 Entropulse 機制,增強探索與策略多樣性。
? MobileRL:創(chuàng)新難度自適應強化學習方法(推理自舉預熱 + 難度自適應 GRPO),顯著提升移動端任務的穩(wěn)定性與收斂效率。
? AgenRL:通過交叉采樣與任務優(yōu)勢歸一化機制,解決多任務訓練中的不穩(wěn)定與梯度分布不均,增強整體魯棒性與效率。
在 Device Use 基準測試(涵蓋手機、電腦和網頁操作)中,AutoGLM 整體表現優(yōu)于 ChatGPT Agent、UI-TARS-1.5 和 Claude 4 Sonnet,展現出更強的魯棒性與通用性,已處于主流 Agent 的*水平。



155708/20








