科技

解密OpenClaw狂潮:一個本機AI代理讓Mac mini賣到缺貨,為何敢預言80% App都會消失?

編輯部 15小時前 6 瀏覽
解密OpenClaw狂潮:一個本機AI代理讓Mac mini賣到缺貨,為何敢預言80% App都會消失?
在摩洛哥馬拉喀什(Marrakesh)的一場生日派對上,奧地利工程師 Peter Steinberger 對著自己開發的 AI 代理原型(當時在他的私人環境中被稱為「Multi」)發送了一則語音訊息,試圖測試其反應。

按照傳統軟體工程的集成範式(API-integration paradigm),這則訊息理應失敗,因為 Steinberger 根本沒有預設過處理音檔轉譯的功能模組。然而,9 秒鐘後,手機震動了。

Multi 不僅回覆了語音內容,還交代了處理語音訊息的過程: 它偵測到一段無副檔名的數據流,透過分析 Header 確認其為美國格式(US format);隨後,它自主調用了系統底層的 ffmpeg⁠ 將其轉為 ⁠.wav⁠。

更關鍵的決策是: Multi 發現本地未安裝 Whisper 模型,且意識到即時下載模型帶來的延遲將無法滿足交互需求,於是檢索了系統內的 OpenAI Key,透過 ⁠curl⁠ 直接調用外部 API 完成轉譯。

這 9 秒鐘的過程,展示了當程式碼模型的邏輯推演能力被賦予作業系統級權限時,AI 將從一個被閹割的「工具」轉向擁有自主裁量權的「代理人」,也催生了讓蘋果 Mac mini 銷售一空的 OpenClaw。

延伸閱讀:我該學OpenClaw嗎?它跟ChatGPT、Cursor、Lovable、Manus能做的事有什麼不同?

OpenClaw 就是最近那隻「會自己動手做事」的紅色龍蝦 AI 助理。本質上它是一個開源的個人 AI agent 框架,可以常駐在你自己的機器或雲端,幫你自動整理信箱、發信、管行事曆、連動 Slack/Telegram 等等,不只是聊天,而是真的去「操作你的電腦、幫你執行工作」。

近期,Peter Steinberger 接受 Y Combinator 訪談,談他開發 OpenClaw 的過程與思路。

要先回答的是,Steinberger 為何要開發 OpenClaw?一個概括性的原因是:不夠自由。AI 能做的,遠比 ChatGPT、Claude、Gemini 所聲稱能辦到的更多。

從更技術的角度來看,雲端 AI 雖然擁有更強的算力,卻受困於嚴苛的「沙盒困境」(The Sandbox Problem)。關於「雲端代理」與「本地代理(OpenClaw)」的權力差異如下:

雲端代理 (Centralized AI)

本地代理 (OpenClaw / Multi)

依賴廠商合作與脆弱的第三方 API

直接存取核心 CLI(控制燈箱、Tesla、Sonos、床溫)

數據資產化,存在隱私洩漏與監管風險

記憶以 Markdown 形式存於本地,用戶絕對擁有

被禁錮在雲端應用的「數據孤島」中

擁有整台電腦的歷史遺產存取權(如:一年前的錄音)

封閉的集成 (Integrations)

具備「創造性解決問題」能力,可即興組合本地工具

Steinberger 的洞察在於: 雲端代理無法真正觸達用戶的「私有邊界」。

意思是,它不能調節你特斯拉的空調,不能控制你床上的 Sonos 音響,更無法在你毫無察覺的本地舊資料夾裡,翻出一年前的錄音並編織一段年度敘事。

因此,OpenClaw 在 GitHub 獲得 16 萬星的瘋狂追捧,本質上是用戶對「本地控制權」的回歸。

Steinberger 提出了一個類似「蜂群智慧」(Swarm Intelligence)的比喻:單一的人類無法製造出 iPhone,但社會分工可以。

同理,雲端 AI 試圖扮演全知全能的「上帝」,而 OpenClaw 則是無數個專注於本地任務、具備高度權限的「專業分工者」。

在商業競爭中,OpenClaw 的終極價值,不在於它「能做什麼」,而在於它「是誰」。

大多數開發者傾向於使用 Claude 或 GPT 預設的、充滿公關腔調的「專業模板」。Steinberger 卻將其視為「無趣的 Brad」(Boring Brad)。他為 Multi 注入了極強的個性,具體封裝在 ‎⁠Soul.md⁠ 與 ‎⁠identity.mmd⁠ 這兩個核心檔案中。

為了驗證「個性即安全」這個非共識洞察,Peter 曾進行過一場激進的實驗:他在 Discord 公開頻道上線了 Multi,且未設任何硬性過濾邏輯,僅在 ‎⁠Soul.md⁠ 中規定它的性格與原則。結果顯示,當用戶嘗試進行「指令注入攻擊」(Prompt Injection)時,代理人並非彈出冷冰冰的錯誤提示,而是以諷刺和幽默的方式嘲諷攻擊者。

這揭示了一個規律:編碼能力(Coding capability)本質上是 LLM 對抽象邏輯推理能力的最高代理指標。當一個模型能解決複雜的程式碼邏輯時,它就具備了處理現實世界模糊任務的「推理即服務」(Reasoning-as-a-Service)。Multi 在馬拉喀什選擇 ‎⁠curl⁠ 而非下載 Whisper,正是這種邏輯推演能力的溢出。

在說完了 OpenClaw 的特別之處後,它又是怎麼被開發出來的?

OpenClaw 的開發過程展現了一種與主流工程學背道而馳的「極簡主義」。這種策略支撐了 Steinberger 在極短時間內應對 16 萬星社群成長的壓力。

拒絕封裝: 當業界在為 MCP(Model Context Protocol)的標準爭論不休時,Steinberger 選擇回歸 Unix CLI。他開發了名為 Makeporter 的工具,將 MCP 轉化為 CLI 介面。理由是:AI 本就擅長 Unix 指令,CLI 是給機器與人類最公平、最具擴展性的共同工具,且無需像雲端 IDE 那樣頻繁重啟。

物理隔離: Peter 拒絕使用 Git Worktrees 或複雜的分支策略。他採用了一種看似原始、實則高效的模式:在本地存放多個資料夾副本,全部維持在 ‎⁠main⁠ 分支。他將 Git 分支視為「心流的稅收」,透過切換實體資料夾,把單一開發者的「認知負載」降到最低。

低流程的開發文化: 這種「個體即公司」的開發模式,證明了在 AI 輔助下,單兵作戰的工程效率可以徹底碾壓體系臃腫的 VC 資助團隊。

後面的事情,大致就如大家所看到的那樣。Steinberger 發現,與其解釋 OpenClaw 的強大,不如將 Bot 直接放入一個公開的 Discord 頻道,且沒有設太多限制(僅限制只能聽從他的指令,但會回應所有人)。

換言之,他讓公眾親眼看著他用 Bot 寫程式、修復 Bug,甚至讓駭客嘗試攻擊它。這種「實戰演示」讓社群直接體驗到了產品的強大與自然互動,也讓 OpenClaw 在短時間內一炮而紅。

Steinberger 在訪談過程中也拋出了一個對 SaaS 行業不太友善的預言:未來 80% 的 App 將會消亡。

他認為,絕大多數的 App 只是在管理數據(如健身紀錄、待辦事項)。未來,我們不需要開啟特定的 App 來輸入數據,AI 代理會根據我們的位置(例如在速食店)或行為,自動記錄並管理這些資訊。

因此在 AI 時代,唯有具備獨特硬體感測能力(如血壓計、專業光譜儀),或擁有「專屬硬體數據」的 App,才具備生存空間,其他的都會被 AI 代理取代。

而在 AI 代理功能逐漸接近 AGI 之際,Steinberger 認為,大型語言模型(LLM)公司試圖透過建立「數據孤島」(Data Silos)來綁住用戶,但這種模式正面臨 OpenClaw 這類本地端代理(Local Agents)的挑戰。

舉例來說,用戶在 ChatGPT 累積的記憶與互動數據,很難被導出或轉移到其他平台。如果另一家公司無法存取這些記憶,用戶就被迫留在原本的生態系中,因為那是唯一「了解」他們的地方。

而 OpenClaw 的存在就打破了這個限制。因為 Steinberger 設計讓 OpenClaw 的記憶,直接以 Markdown 檔案 的形式儲存在使用者的本地電腦上。這意味著使用者完全擁有自己的數據。Steinberger 形容,這就像是 OpenClaw 將數據從公司的孤島中「抓」(Claw)回來給使用者。

也由於記憶是簡單的 Markdown 文件,使用者可以隨時查看、編輯,甚至帶著這些數據更換不同的 AI 模型,而不受限於單一供應商——畢竟,如果要雇用長期的私人管家,自己招募的彈性遠比透過人力公司派遣更好。

延伸閱讀:黃仁勳點名「實體AI」!搶蓋機器人虛擬訓練營,台灣製造鏈如何搶下大腦商機?

Steinberger 最後指出,未來的 AI 不會是一個單一的全能「上帝模式」(God intelligence),而是走向 「群體智慧」(Swarm intelligence)。

換言之,我們會擁有多個專精的 Bot:一個負責工作、一個負責私人生活、一個負責人際關係。這些 Bot 之間會互相溝通,甚至與外部的 Bot(如餐廳的預約 Bot)進行協商,就像人類社會透過分工合作來達成目標一樣。

技術層面上,「CLI(命令列介面)才是未來」。Steinberger 證明了,不需要複雜的協議(如 MCP)或圖形介面。CLI 是人類與機器都能理解的高效語言。讓 Bot 像人類工程師一樣使用終端機和現有工具,比重新發明一套 AI 專用的互動方式更具擴充性與實用性。

最後,訪談強調了性格(Personality)的重要性。單純的工具是無聊的,透過 ‎⁠soul.md⁠ 注入價值觀與性格(例如幽默、俏皮),能讓 AI 從冷冰冰的工具,轉變為用戶願意長期互動的「夥伴」或「朋友」。

延伸閱讀: AI龍蝦Clawdbot(Moltbot)懶人包|有資安疑慮嗎?跟ChatGPT、Gemini有何不同?要收費嗎? ChatGPT、Gemini、Claude、Perplexity、NotebookLM 最強組合技解析,5 個 AI 工具打造高效工作流!

資料來源:Y Combinator

本文初稿為AI編撰,整理.編輯/ 李先泰

更多報導Gamma免費點數用完怎麼辦?盤點10款免費AI簡報工具,這款連PPT原始檔都能直接下載AI指令怎麼下比較好?簡立峰、AI大神們都在用:一次收藏7大提示詞思維!你的 AI 老是寫出英式中文?跟著翻譯系主任學「去 AI 味」的5種魔法

新聞來源: 原始來源

分享本文
請登入後發表評論
立即登入

尚無評論,成為第一個發言的人吧!

首頁 新聞 商家 活動 聊天底