
今天是真的被 Manus 刷屏了,想过 AI 的未来是 AI Agent,但没想到突破口藏在如此具象的场景里——当虚拟机里的 Chrome 开始自行点击按钮,才惊觉硅基生命真的长出了手指。
从大脑到手指的进化
Manus 的演示用最直白的方式诠释了知识工作流:
- 信息捕捞(浏览器翻页比人类更快)
- 拼图时刻(把剪贴板变成短期记忆区)
- 代码验算(写段 Python 来验证猜想)
- 包装交付(套用模板生成标准化文档)
这和人类处理复杂任务的模式惊人的相似,区别在于 AI 完成任务时会生成清晰的路径日志,而我们大脑皮层下的工作记忆早就模糊成一团。
简单的答案与漫长的征途
这类方案的可怕之处正在于它的易懂性:
- 低垂果实:大厂完全能用现有技术堆出相似框架(比如用 Wasm 沙盒替代虚拟机)
- 护城河困境:Manus 真正的价值可能在那些 Demo 里没展示的细节——当网页按钮突然改版时,AI 要怎么判断自己是否点错了位置?
- 速度博弈:从原型到产品需要的迭代周期,可能比技术突破本身更残酷
但无论如何,当 Monica.IM 这类项目开始用数字手指解开现实世界的绳结时,属于 AI Agent 的蒸气朋克时代算是真正拉开了阀门。

