Appearance
区分 Chatbot、Workflow、Agent、Multi-agent
简单来说,它们的核心区别在于“谁来做决策”以及“如何做决策”:
- Chatbot:你说一句,它回一句。核心是对话。
- Workflow:你设定好步骤,它按部就班执行。核心是固化流程。
- Agent:给它一个目标,它自己想办法、选工具去完成。核心是自主决策。
- Multi-Agent:多个 Agent 分工协作,解决一个复杂问题。核心是协作与竞争。
Chatbot(聊天机器人)
这是你最熟悉的形态。它像一个“问答专家”或“闲聊伙伴”。
- 核心逻辑:输入 → 大模型推理 → 输出。每次对话通常是独立的,或者只依赖有限的短期记忆(对话历史)。
- 能力:理解自然语言、生成回复、进行多轮对话。
- 决策权:几乎没有。它不会主动去做什么,只是被动响应你的指令(“讲个笑话”“写首诗”)。
典型例子
- 早期的客服机器人(基于关键词匹配)。
- 简单的 ChatGPT 对话(你问“法国的首都是哪里?”它答“巴黎”)。
- 微信上的各种 AI 助手。
局限性
它无法完成复杂任务。比如,你让它“帮我预订今天下午3点从公司到机场的专车”,它要么拒绝,要么只给你一个订车链接,无法真正替你执行。
Workflow(工作流)
Workflow 是确定性的自动化。它像一条“流水线”或“工厂里的机械臂”。
- 核心逻辑:预设流程 + 规则引擎/大模型节点。开发者会事先用代码(如
if-else)或图形化工具(如 LangChain 的Chain)定义好每一步做什么,顺序如何。 - 能力:执行一系列固定步骤。可以在某个步骤调用大模型做判断,但整个流程的骨架是固定的。
- 决策权:没有。无论是执行顺序还是异常处理,都是预先写死的。它没有“选择”的余地。
典型例子
- 自动邮件回复:收到邮件 → 判断是否为投诉 → 是 → 分类严重程度 → 生成回复草稿 → 发给主管审核。
- 数据处理 ETL:读取 CSV → 清洗空值 → 用大模型提取摘要 → 存入数据库。
- RAG(检索增强生成):用户提问 → 向量检索相关文档 → 拼接 Prompt → 调用大模型 → 输出答案。这是一个非常典型的 Workflow,每一步都是固定的。
与 Chatbot 的区别
Chatbot 是“一次性”的对话,而 Workflow 是“多步骤”的任务流水线。你可以把 Chatbot 理解为一个没有 Workflow 的“单步任务”。
Agent(智能体)
Agent 是非确定性的自动化,具有自主决策能力。它像一个“聪明的实习生”:你告诉它目标,它自己会想“我该先做什么?用什么工具?如果失败了怎么办?”。
- 核心逻辑:观察 → 思考 → 行动 → 观察 → 循环,直到达成目标。这个循环通常被称为 ReAct(Reason + Act,推理与行动结合)。
- 思考:大模型根据当前状态、记忆和目标,制定下一步计划。
- 行动:调用一个“工具”(Tool),如搜索引擎、计算器、API、代码解释器等。
- 观察:获取工具返回的结果,更新状态。
- 能力:使用工具、制定计划、进行推理、拥有长期和短期记忆。
- 决策权:有。Agent 自己决定下一步做什么、用什么工具、何时终止。流程是动态生成的。
典型例子
- 自动订票:用户说“帮我订下周去北京的机票”。Agent 会:1)思考“需要知道具体日期、预算、偏好” → 2)行动:反问用户获取信息 → 3)观察:得到信息 → 4)思考“现在需要查询航班” → 5)行动:调用机票查询 API → 6)观察:得到航班列表 → 7)思考“选出最便宜的” → 8)行动:调用预订 API → 完成。
- 自动科研助手:给它一个论文标题,它可以:1)搜索相关论文 → 2)下载 PDF → 3)提取摘要 → 4)总结对比 → 5)生成一份文献综述。
与 Workflow 的关键区别
- Workflow:路径固定。你告诉他“第一步查机票,第二步选最便宜的,第三步预订”。
- Agent:路径动态。你只告诉他“订机票”,他 自己 决定用哪一步、用什么工具、甚至可能在查完机票后发现今天没有,转而建议你改期。Agent 是 Workflow 的泛化,Workflow 是 Agent 的一种特例(即策略完全确定的 Agent)。
Multi-Agent(多智能体系统)
当单个 Agent 能力有限,或者任务过于复杂时,就需要多个 Agent 分工协作。它像一个“项目团队”或“蚁群”。
- 核心逻辑:多个 Agent 通过某种机制(环境、消息、黑板)进行交互。每个 Agent 有自己的角色、目标和能力。
- 能力:1+1 > 2。通过分工、协作、竞争甚至辩论,解决单个 Agent 难以处理的问题。
- 决策权:分布式的。每个 Agent 有自己的决策模块,整体行为是涌现出来的。
- 典型模式:
- 协作模式:一个 Agent 负责任务分解(项目经理),一个负责写代码(程序员),一个负责测试(测试员)。他们互相发送消息,共同完成一个软件项目。
- 辩论模式:两个 Agent 持有相反观点,进行辩论,由第三个 Agent 做裁判,从而得到更准确的答案(例如,在事实核查任务中)。
- 竞争模式:多个 Agent 执行相同任务,最后投票选出最佳结果(提升可靠性)。
典型例子
- AutoGen(微软框架):可以创建一个 UserProxy Agent(代表用户)和一个 Assistant Agent(AI助手),它们对话协作解决编程问题。
- 游戏 AI:在即时战略游戏中,有负责采集资源的农民 Agent、负责战斗的士兵 Agent、负责侦查的侦察兵 Agent,它们共同为“赢得比赛”这个全局目标服务。
与单个 Agent 的区别
单个 Agent 是“全能超人”,什么都会但可能什么都不精;Multi-Agent 是“专业团队”,各司其职,通过沟通解决更复杂的问题。Multi-Agent 是 Agent 的一种高阶组织形式。
一个生动的对比:做一顿晚餐
为了让你更直观地理解,我们以“做一顿晚餐”为例:
Chatbot(问答模式):
- 你问:“番茄炒蛋怎么做?”
- 它答:“第一步,打鸡蛋……第二步,切番茄……”
- 结果:你得到了菜谱,但饭需要你自己做。
Workflow(流水线模式):
- 你按下一个按钮:“做番茄炒蛋”。
- 预设流程:切菜机器人1号切番茄 → 搅拌机器人2号打鸡蛋 → 炒菜机器人3号按固定时间翻炒 → 装盘。
- 结果:饭做好了,但每一步都是固定的。如果鸡蛋没了,整个流程就会卡死报错。
Agent(智能管家模式):
- 你对一个全能管家说:“我饿了,做一顿晚餐。”
- 它会自己思考:“冰箱里有什么?番茄、鸡蛋。我可以做番茄炒蛋。还需要米饭。” → 行动:查看电饭煲,发现米不够。 → 思考:“需要买米。” → 行动:打开生鲜 APP 下单。 → 等待米送到 → 行动:开始做饭。如果鸡蛋坏了,它会自动决定“改做番茄豆腐”。
- 结果:饭做好了,而且过程中所有决策都是它自己做的。你只需要给出目标。
Multi-Agent(专业团队模式):
- 你对团队说:“今晚举办一个10人的晚宴。”
- 主厨 Agent:规划菜单(前菜、主菜、甜点)。
- 采购 Agent:根据菜单去超市或电商平台采买。
- 助理 Agent:洗菜、切菜、准备餐具。
- 主厨 Agent:负责烹饪,并指挥助理递调料。
- 品控 Agent:尝味道,建议加盐。
- 结果:一桌丰盛的晚宴完成。分工协作让复杂任务变得高效可靠。
核心总结表
| 概念 | 决策者 | 流程 | 工具使用 | 复杂度 | 典型应用 |
|---|---|---|---|---|---|
| Chatbot | 用户 (完全由用户驱动) | 无,单轮/多轮对话 | 无 | 低 | 客服、闲聊、问答 |
| Workflow | 开发者 (预先编码) | 固定、确定性 | 有,但调用方式固定 | 中 | RAG、数据处理、邮件自动回复 |
| Agent | 大模型 (自主决策) | 动态、非确定性 | 有,自主决定何时调用 | 高 | 自动化订票、科研助手、个人助理 |
| Multi-Agent | 多个Agent (分布式) | 涌现、协作/竞争 | 各有工具,协作使用 | 很高 | 复杂软件开发、模拟社会、辩论系统 |
一句话记住:Chatbot靠问,Workflow靠编,Agent靠想,Multi-Agent靠聊。
