Unix :AI时代的罗马战车
最近,我开始对 Unix 产生了极大的好奇。
起因是近期大火的 AI 编程工具 Claude Code。在这个所有人都在卷图形界面、卷 IDE 插件的时代,它却极其反直觉地一头扎进了黑乎乎的终端(Terminal)里。事实证明,它的火爆直接“带货”了古老的 Unix。
为什么 Claude Code 会选择终端?因为在 Anthropic 的产品战略和人机交互设计中,这是让 AI Agent 最高效工作的最优解: 主动拥抱 Unix 哲学。
在 Unix 的世界里,“一切皆文件”。Claude Code 被设计为对本地文件系统具有极强的读写与感知能力。它不需要你手动把代码复制粘贴到网页里,而是直接在当前工作目录读取代码、修改文件,甚至直接调用标准的系统工具和集成 Git。
大语言模型(LLM)本质上是处理文本输入和输出的机器,而 Unix 的核心恰恰是“一切皆文件”和“纯文本流(管道)交互”。当 AI 在终端里运行时,它能完美地将 Unix 工具串联起来:一条命令读取文件(文本流入 AI),AI 分析问题,再输出指令写入文件(文本流出 AI)。这种基于底层工具调用(Tool Use)的设计,既轻量,又极其强大。
这引发了我的一个思考:Unix 似乎正在成为 AI 时代的底层规范。它就像那个著名的“罗马战车与铁轨”的故事。
罗马战车两匹马的屁股宽度,决定了英国早期马车的轮距,进而决定了现代铁轨的标准轨距。最终,因为装载在火车上的航天飞机固体火箭助推器必须要穿过沿途的隧道,这两匹马的屁股宽度,间接限制了今天人类探索宇宙的火箭宽度。
在软件和 AI 领域,Unix 就是那辆规定了后续一切“轨距”的罗马战车。
但这条铁轨,可能只限于电脑端。
虽然移动端的 iOS 和 Android,其底层根基也是 Unix,但它们的核心生命线,是一堵名为“沙盒(Sandbox)”的高墙。这堵墙是移动操作系统的商业护城河与安全底座,但也无情地斩断了 AI 游走于全局文件系统的可能。
在电脑端,Anthropic 可以推出带有精美界面的 Claude Cowork,把那层“黑乎乎的命令行”遮住,让不懂代码的白领也能享受到底层 Unix 强大的本地文件处理能力。但在手机上,底层的 Unix/Linux 已经被死死锁在了地下室。AI 彻底告别了 Unix 时代的“文件流”交互。
因而,安卓和 iOS 都需要铺设新的铁轨。
苹果给出的“现代铁轨”主要由三部分组成:
- App Intents(应用意图): 开发者提前定义好 App 能做什么(如点咖啡),Siri 直接调用这些暴露出来的标准化 API,而不是去敲命令行。
- On-screen Awareness(屏幕感知): 对于没接 API 的老 App,AI 利用系统底层权限,直接“看懂”屏幕上的文字和图像来获取上下文,并代为操作。
- Semantic Index(语义索引): 为了打破 App 之间的“沙盒”孤岛,苹果在系统底层建立了一个本地语义网。AI 无需破解沙盒,只需查询索引库,就能跨应用调取数据。
最近,谷歌也给出了直接对标的答案:对应应用意图的 AppFunctions,以及对应屏幕感知的 Intelligent UI Automation(智能 UI 自动化)。
同个时间里,这套规则具象化为了一个极具代表性的工业样本:FunctionGemma 270M。这个只有 2.7 亿参数的微型模型,完美演示了“新铁轨”的逻辑:它不再理解复杂的 Unix 目录,而是被专门精调成一个纯粹的“指令翻译官”。当你说“打开手电筒”,它在本地飞速运转,直接将你的意图转化为标准的函数调用指令。
哪怕在最封闭的 iOS 系统里,这类模型(可在appstore里下载Edge Gallery体验)也能通过与苹果 App Intents 的 API 轨道对接,精准驱动硬件。这再次验证了移动端 AI 的进化方向:它不需要成为“读写文件的黑客”,它只需要成为“对准接口的管家”。
总结来说,受限于严格的安全沙盒,移动端 AI 已经彻底抛弃了 PC 端“纯文本+底层文件”的 Unix 玩法。AI 变成了一个高度拟人化的“超级协调员”。它在各个沙盒应用之外游走,通过合规的 API 接口和屏幕视觉(UI 树),指挥各个 App 完成任务。
这也揭示了一个冷酷的商业现实:外界总觉得苹果在 AI 大模型之战中慢半拍,但只要苹果掌握着移动端系统入口,拥有定义“新铁轨”的权力,它就永远握有掀桌子和制定游戏规则的底牌。
不信?我们来看看现实世界中的极端实践。
去年引发热议的“豆包手机”,是字节跳动为了让 AI 顺畅操控 App,不惜亲自下场找手机厂商改系统。拿到了系统级特权的豆包,试图用极速的“系统级 UI 自动化”去替用户点外卖、比价格。但现实无比冷酷:微信、淘宝等超级 App 坚守着自己的沙盒高墙,当它们察觉到非人类的自动点击时,立刻触发风控机制,用“登录环境异常”的弹窗对豆包进行了集体拦截。这证明了:哪怕你拉拢了操作系统,只要超级 App 们不向你开放“意图接口”,你的 AI 依然会撞死在沙盒的高墙上。
而面对这堵高墙,民间极客们为了在手机上使用像 OpenClaw 这样强大的 PC 端 AI,甚至分化出了两条极其魔幻的求生路线:
第一条路是“造城”,硬磕沙盒。 当你打开开源项目“AnyClaw”时,你会看到极其赛博朋克的一幕:为了让纯正的 AI 在安卓上活下去,极客们竟然把一整个完整的 Linux 操作系统(包含 Node.js 运行环境和底层终端),硬生生地塞进了一个普通 APK 安装包里。既然苹果和谷歌不让 AI 触碰底层的 Unix 铁轨,那就在自己的小黑屋(沙盒)里,人工造一条微型的 Unix 铁轨。在这个封闭的 App 里,AI 依然在敲击命令行、读写内部文件。
第二条路是“逃离”,手机沦为遥控器。 就像另一个项目“ClawBridge”。开发者彻底放弃了在手机上跑 AI 的幻想。他们的做法是:把 AI 老老实实地养在云端服务器(纯正的 Unix 领地)里,然后通过内网穿透技术,把 AI 的“控制台”变成一个可以在手机浏览器里打开的网页。在这个架构下,AI 根本没有在手机上运行,手机仅仅退化成了一块远程监视器。这套逻辑与极客们抢购 Mac Mini 作为 AI 主机的风潮如出一辙——既然手机沙盒不可逾越,那就让 AI 留在它最舒适的桌面级 Unix 环境里,手机只负责指令的下达。
理解了沙盒与 Unix 这层水火不容的博弈,你就会明白另一个现象。
最近,有人在讨论:要是苹果能给搭载桌面级 M 系列芯片的 iPad 加上原生终端(Terminal)该多好。我猜想,他们也许正是幻想着,能在这个性能怪兽上直接原生地跑起 OpenClaw。
为什么会有这种想法?本质上,这就是极客们想把 PC 时代的“Unix 铁轨”强行砸进移动生态,让 iPad 彻底摆脱“大号爱奇艺”的命运,变成真正的生产力神器。
但这注定只是幻想。开放原生终端,赋予应用读取全局文件系统的权限,就等于亲手炸毁维系着整个苹果移动生态的安全沙盒。苹果既然已经在 iOS 生态里全面押注了“意图接口与屏幕感知”的新铁轨,就绝不可能为了成全极客们的 Unix 梦,而倒退回老路。
从 Claude Code 对 Unix 哲学的复兴,到极客们花式突围沙盒的惨烈,科技发展的脉络已然清晰。桌面端与移动端的 AI,注定要在两条平行的铁轨上分道扬镳。
前者的灵魂,依然是那个信奉 Unix 哲学的超级黑客。只要拥有文件系统的万能钥匙,它能在全盘畅通无阻;而后者,受限于移动端的沙盒高墙,无论表面多么全能,本质上都只能顺应巨头的新规,做一个在 API 接口之间戴着镣铐跳舞的优雅管家。