2022 年底 ChatGPT 出来时,它能做的只有一件事——你给文字,它给文字。它不能上网、读文件、跑代码、改你电脑上的东西。
你:帮我写一个 Python 脚本算销售额 ChatGPT:好的,[给你一段代码文本] 你:(自己复制 → 自己建文件 → 自己粘贴 → 自己运行)
所有动作都得你亲自干,AI 只负责说话——像一个"很有经验的顾问",告诉你怎么做,但不替你做。
OpenAI 和 Anthropic 几乎同时上了一个新能力:给 AI 一份"工具清单",AI 可以主动要求调用,由系统帮它执行。
你:帮我读一下 report.txt 里的内容 AI:我想调用 read_file("report.txt") ← AI 主动提出 系统:[执行调用,读到"销售额 100 万..."] AI:文件内容是销售额 100 万... ← 拿到结果继续回答
关键突破:AI 第一次能影响外部世界——但一次只能调一个工具,复杂任务还是干不了。
真正的复杂任务需要连续操作 N 步。比如让 AI:"把项目里所有 TODO 改成 DONE"——它要找文件、读、改、再找下一个,循环到全部完成。这种 "AI 自己决定下一步 → 执行 → 看结果 → 再决定下一步" 的循环,叫 Agent(智能体)模式,俗称 Agentic Loop。
| 阶段 | 代表产品 | 你要做的 | AI 做的 |
|---|---|---|---|
| 纯对话 | 早期 ChatGPT | 看答案,亲自动手 | 说话 |
| 工具调用 | GPT-4 带插件 | AI 帮 1-2 步,复杂任务还得自己做 | 帮你查/算 |
| Agent | OpenClaw、Claude Code、WorkBuddy | 说目标,AI 自己跑完 | 替你执行整个任务 |
"龙虾"这个梗,起源于开源 AI Agent 项目 OpenClaw 的红色龙虾 logo。
后来扩展成对整个 AI Agent 生态的代称——不限于某一家公司、某一款产品。
广义龙虾 = OpenClaw 引发的、所有"AI + Agent + 能干活"类产品的统称。
| 说法 | 实际指什么 |
|---|---|
| OpenClaw | 独立开源 AI Agent 项目(Peter Steinberger 创建 / MIT 协议 / openclaw.ai) |
| 龙虾 / 大龙虾 | OpenClaw 的民间昵称(来自项目的红色龙虾 logo) |
| 龙虾家族 / 龙虾生态 | 受 OpenClaw 启发/衍生的一系列 AI Agent 产品(如腾讯 WorkBuddy 等)的统称 |
| 🦞 logo | OpenClaw 项目的官方吉祥物 |
| 阵营 | 代表产品 | 形态 | 备注 |
|---|---|---|---|
| 开源 / 个人 | OpenClaw | CLI / Agent 框架 | 龙虾鼻祖,MIT 协议,社区驱动 |
| Anthropic 原生 | Claude Code | CLI | 纯编程,能力强,要梯子 |
| Anthropic 原生 | Claude Desktop | 桌面 App | 通过 MCP 接本地 |
| 独立创业 | Cursor / Windsurf | 独立 IDE | VSCode fork,最火 |
| 开源社区 | Cline / Roo Code | VSCode 插件 | 开源免费党首选 |
| 腾讯 | CodeBuddy | CLI / 插件 | 国内直连,接腾讯生态 |
| 腾讯 | WorkBuddy | 桌面 App | 面向非开发者办公 |
| 字节 | TRAE | 独立 IDE | VSCode fork,免费 |
| 字节 | MarsCode | 插件 / 网页 IDE | 偏教育和云端开发 |
| 阿里 | 通义灵码 | 插件 / 独立版 | 程序员向 |
| 形态 | 能否操作本地文件 | 例子 |
|---|---|---|
| CLI 命令行 | ✅ 能 | OpenClaw、Claude Code、CodeBuddy CLI |
| 独立 IDE | ✅ 能 | Cursor、TRAE、Windsurf |
| IDE 插件 | ✅ 能 | 通义灵码、Cline |
| 桌面 App | ✅ 能 | WorkBuddy、Claude Desktop、豆包桌面版 |
| IM 内插件 | ❌ 不能 | 飞书 AI、企微 AI、钉钉 AI |
| 网页 / 小程序 | ❌ 不能 | 千问网页版、扣子、夸克 AI |
定义:AI 自主决定下一步 → 执行 → 看结果 → 再决定下一步,直到任务完成。
意义:让 AI 从"答题机"变成"会干活的助手"。
三个都满足 → 真 Agent;只是单次问答 → 还停在"工具调用"阶段
定义:AI 模型本身的能力——按统一格式说出"我要调用某个工具",由外层程序去执行。
这是 Agent 的"基础协议",所有龙虾都靠它运转。
| 工具类型 | 代码在哪 | 例子 |
|---|---|---|
| 内置工具 | 产品本身代码里 | Read、Write、Edit、Bash、Grep |
| MCP 工具 | 外部 MCP Server 里 | GitHub MCP、腾讯文档 MCP、飞书 MCP |
定义:Anthropic 2024 年开源的标准,让"AI 产品"和"外部服务"用统一格式对话——类似 AI 界的 USB-C 接口。
黑框框,敲英文命令,电脑执行后打印结果。
$ ls document.txt photo.jpg $ python calc.py 结果: 42
OpenClaw、Claude Code 都是典型的 CLI Agent 工具。非程序员看到黑框框就不敢动——这是它的天然门槛。
程序员的"超级 Word":把"写代码 + 跑代码 + 调试 + 版本管理"集成在一个窗口。
代表:VSCode(最火,免费)、JetBrains 全家桶(IntelliJ/PyCharm,专业但收费)、Visual Studio。
微软 2015 年出的免费 + 开源 + 跨平台的轻量 IDE,全球份额 70%+。
这就是为什么所有 AI IDE 都 fork 它——自己写一个 IDE 要 5-10 年、上百人、上亿预算,fork 只要几个月。
把别人开源的代码复制一份,改成自己的产品。
代表性 fork:Cursor、Windsurf、TRAE、通义灵码独立版 → 全是 VSCode fork。这些产品的编辑器内核都是 VSCode,差异在 AI 集成、UI 主题、商业模式上。
| 词 | 干啥的 | 例子 |
|---|---|---|
| 编辑器 | 写和改代码文本 | VSCode、Sublime |
| 编译器 | 把代码翻译成机器指令 | GCC、javac |
| 解释器 | 一边读一边执行 | Python、Node.js |
| IDE | 编辑器 + 编译器调用 + 调试器 + 终端 + 一堆插件的集成 | VSCode + 插件 ≈ IDE |
你(WorkBuddy 聊天框):把首页标题改成蓝色 ↓ WorkBuddy 内部 AI: 调 Glob → 找到首页文件 调 Read → 读出代码 调 Edit → 把 color: black 改成 color: blue 调 Bash → 跑 npm run build ↓ 你硬盘上的文件被改了
整个过程没有任何 IDE 参与。因为 IDE 的所有 UI(语法高亮、自动补全、可视化 diff)都是为"人写代码"服务的——AI 写代码不需要这些,它直接读纯文本、改纯文本就行。
| 你的场景 | 推荐工具 |
|---|---|
| 写代码(哪怕是新手) | Cursor(国外)/ TRAE(国内免费) |
| 办公场景:写汇报、做 PPT、跑数据 | WorkBuddy |
| 临时小问题,不想装东西 | 千问 / 豆包 / DeepSeek 网页版 |
| 团队协作:群聊里 @AI 帮忙 | 飞书 AI、企微 AI |
| 想自己玩 Claude 但又不会装 | Claude Desktop(要梯子) |
WorkBuddy = 桌面 App + Agent Loop + Tool Use + 内置工具 + MCP 连接器 + 面向非开发者办公场景
| 对比对象 | WorkBuddy 的差异 |
|---|---|
| vs OpenClaw | 更适合非开发者的 GUI 体验 + 国内直连;OpenClaw 是开源 CLI / 框架,自由度更高但门槛高 |
| vs Claude Code | 多了非编程办公能力 + IM 生态 + 国内直连;少了纯编程深度 |
| vs 通义灵码 / TRAE | 覆盖了他们不碰的"非开发者办公"场景 |
| vs 飞书 AI / 企微 AI | 能操作本地文件、跑 Excel/Python;他们只能在 IM 里玩 |
| vs 豆包桌面版 | 是 Agent 化工作流;豆包是聊天 + 屏幕操作(不同范式) |