在AI工具领域,"龙虾"(OpenClaw)最近引发了广泛关注,网络上出现了两极分化的讨论。有人称它是未来的万能工具,有人则认为它毫无用处甚至是个骗局。相关服务的价格也五花八门,从70美元的安装费到40美元的卸载费都有。那么OpenClaw的真相到底是什么?让我们从头拆解。
从大语言模型(LLM)开始
像ChatGPT这样的LLM本质上是问答系统。要与它们进行程序化交互,我们使用API接口。OpenAI和Anthropic Claude等主要LLM提供商提供基于HTTP的API,而OpenRouter等中间商甚至提供SDK以便于集成(比如用Python)。
来看一个简单例子。取一段官方示例代码,修改LLM模型(例如切换为Claude的Opus 4.6)和输入问题(如用中文问"你好"),然后通过命令行运行。你将收到LLM的回复,证明你可以通过编程方式与LLM交互。
解决LLM的"记忆"问题
LLM没有内置记忆功能。要实现连续对话,每次都需要传入对话历史。维护一个messages列表,将用户问题和LLM回复追加到其中,LLM就会"记住"上下文。
运行改进后的代码,依次询问"你好"、"1+1=?"和"再加1",LLM会正确回答"3",因为它拥有完整的对话历史。
构建Agent
Agent是OpenClaw的核心。它的工作原理是让LLM生成可执行的命令,然后程序自动运行这些命令。
- 设置响应规则:指示LLM用"Command: XXX"或"Done: XXX"格式回复。
- 循环执行:程序循环运行,当LLM输出"Command: XXX"时执行命令,输出"Done: XXX"时结束循环。
例如,要创建包含"hello world"的hello.txt文件,LLM会生成echo "hello world" > hello.txt,程序执行后在本地创建文件。再比如下载并压缩视频,Agent会自动使用yt-dlp下载,再用zip压缩。
OpenClaw的本质
OpenClaw本质上就是Agent循环 + LLM + 提示指令的组合。Agent并不理解命令本身,只是盲目执行。"智能"来自LLM生成命令的能力和预定义的"使用手册"(提示词)。
- 扩展能力:添加"技能文档"(如
skill.md)来教会Agent新命令,例如如何搜索新闻。
- 界面定制:将命令行界面改造为带Web UI的HTTP服务,或集成到飞书/QQ等社交平台进行远程控制——这就是大多数人认识的"龙虾"。
理性看待
OpenClaw既不是万能也不是无用。它的效果取决于世界上的操作是否基于命令或API,以及LLM是否知道这些命令。它推动了操作向命令化和API化发展的趋势,但同时也带来了风险(如执行恶意命令),这呼应了《我,机器人》等电影中的伦理讨论。
简而言之,OpenClaw是一个强大的范式,但其真正的潜力取决于我们的世界能在多大程度上实现命令化和API化。
常见问题
问:使用OpenClaw需要会编程吗?
基本的命令行操作经验会很有帮助。你需要知道如何打开终端、导航目录和运行命令。但你不需要是专业程序员——LLM会处理实际的编码工作。
问:OpenClaw在电脑上运行安全吗?
OpenClaw可以执行LLM生成的任意命令。这很强大但也存在风险。在执行前始终审查命令,特别是当LLM可以访问系统级操作时。建议在沙箱环境中进行测试。
问:OpenClaw可以使用任何LLM吗?
是的。OpenClaw可以与任何提供API端点的LLM配合使用。你可以使用OpenAI、Anthropic Claude或通过OpenRouter可用的任何模型。