Skip to content

区分 Chatbot、Workflow、Agent、Multi-agent

简单来说,它们的核心区别在于“谁来做决策”以及“如何做决策”

  • Chatbot:你说一句,它回一句。核心是对话
  • Workflow:你设定好步骤,它按部就班执行。核心是固化流程
  • Agent:给它一个目标,它自己想办法、选工具去完成。核心是自主决策
  • Multi-Agent:多个 Agent 分工协作,解决一个复杂问题。核心是协作与竞争

Chatbot(聊天机器人)

这是你最熟悉的形态。它像一个“问答专家”或“闲聊伙伴”。

  • 核心逻辑输入 → 大模型推理 → 输出。每次对话通常是独立的,或者只依赖有限的短期记忆(对话历史)。
  • 能力:理解自然语言、生成回复、进行多轮对话。
  • 决策权几乎没有。它不会主动去做什么,只是被动响应你的指令(“讲个笑话”“写首诗”)。

典型例子

  • 早期的客服机器人(基于关键词匹配)。
  • 简单的 ChatGPT 对话(你问“法国的首都是哪里?”它答“巴黎”)。
  • 微信上的各种 AI 助手。

局限性

它无法完成复杂任务。比如,你让它“帮我预订今天下午3点从公司到机场的专车”,它要么拒绝,要么只给你一个订车链接,无法真正替你执行。

Workflow(工作流)

Workflow 是确定性的自动化。它像一条“流水线”或“工厂里的机械臂”。

  • 核心逻辑预设流程 + 规则引擎/大模型节点。开发者会事先用代码(如 if-else)或图形化工具(如 LangChain 的 Chain)定义好每一步做什么,顺序如何。
  • 能力:执行一系列固定步骤。可以在某个步骤调用大模型做判断,但整个流程的骨架是固定的。
  • 决策权没有。无论是执行顺序还是异常处理,都是预先写死的。它没有“选择”的余地。

典型例子

  • 自动邮件回复:收到邮件 → 判断是否为投诉 → 是 → 分类严重程度 → 生成回复草稿 → 发给主管审核。
  • 数据处理 ETL:读取 CSV → 清洗空值 → 用大模型提取摘要 → 存入数据库。
  • RAG(检索增强生成):用户提问 → 向量检索相关文档 → 拼接 Prompt → 调用大模型 → 输出答案。这是一个非常典型的 Workflow,每一步都是固定的。

与 Chatbot 的区别

Chatbot 是“一次性”的对话,而 Workflow 是“多步骤”的任务流水线。你可以把 Chatbot 理解为一个没有 Workflow 的“单步任务”。

Agent(智能体)

Agent 是非确定性的自动化,具有自主决策能力。它像一个“聪明的实习生”:你告诉它目标,它自己会想“我该先做什么?用什么工具?如果失败了怎么办?”。

  • 核心逻辑观察 → 思考 → 行动 → 观察 → 循环,直到达成目标。这个循环通常被称为 ReAct(Reason + Act,推理与行动结合)。
    • 思考:大模型根据当前状态、记忆和目标,制定下一步计划。
    • 行动:调用一个“工具”(Tool),如搜索引擎、计算器、API、代码解释器等。
    • 观察:获取工具返回的结果,更新状态。
  • 能力:使用工具、制定计划、进行推理、拥有长期和短期记忆。
  • 决策权。Agent 自己决定下一步做什么、用什么工具、何时终止。流程是动态生成的。

典型例子

  • 自动订票:用户说“帮我订下周去北京的机票”。Agent 会:1)思考“需要知道具体日期、预算、偏好” → 2)行动:反问用户获取信息 → 3)观察:得到信息 → 4)思考“现在需要查询航班” → 5)行动:调用机票查询 API → 6)观察:得到航班列表 → 7)思考“选出最便宜的” → 8)行动:调用预订 API → 完成。
  • 自动科研助手:给它一个论文标题,它可以:1)搜索相关论文 → 2)下载 PDF → 3)提取摘要 → 4)总结对比 → 5)生成一份文献综述。

与 Workflow 的关键区别

  • Workflow:路径固定。你告诉他“第一步查机票,第二步选最便宜的,第三步预订”。
  • Agent:路径动态。你只告诉他“订机票”,他 自己 决定用哪一步、用什么工具、甚至可能在查完机票后发现今天没有,转而建议你改期。Agent 是 Workflow 的泛化,Workflow 是 Agent 的一种特例(即策略完全确定的 Agent)。

Multi-Agent(多智能体系统)

当单个 Agent 能力有限,或者任务过于复杂时,就需要多个 Agent 分工协作。它像一个“项目团队”或“蚁群”。

  • 核心逻辑多个 Agent 通过某种机制(环境、消息、黑板)进行交互。每个 Agent 有自己的角色、目标和能力。
  • 能力1+1 > 2。通过分工、协作、竞争甚至辩论,解决单个 Agent 难以处理的问题。
  • 决策权分布式的。每个 Agent 有自己的决策模块,整体行为是涌现出来的。
  • 典型模式
    • 协作模式:一个 Agent 负责任务分解(项目经理),一个负责写代码(程序员),一个负责测试(测试员)。他们互相发送消息,共同完成一个软件项目。
    • 辩论模式:两个 Agent 持有相反观点,进行辩论,由第三个 Agent 做裁判,从而得到更准确的答案(例如,在事实核查任务中)。
    • 竞争模式:多个 Agent 执行相同任务,最后投票选出最佳结果(提升可靠性)。

典型例子

  • AutoGen(微软框架):可以创建一个 UserProxy Agent(代表用户)和一个 Assistant Agent(AI助手),它们对话协作解决编程问题。
  • 游戏 AI:在即时战略游戏中,有负责采集资源的农民 Agent、负责战斗的士兵 Agent、负责侦查的侦察兵 Agent,它们共同为“赢得比赛”这个全局目标服务。

与单个 Agent 的区别

单个 Agent 是“全能超人”,什么都会但可能什么都不精;Multi-Agent 是“专业团队”,各司其职,通过沟通解决更复杂的问题。Multi-Agent 是 Agent 的一种高阶组织形式。

一个生动的对比:做一顿晚餐

为了让你更直观地理解,我们以“做一顿晚餐”为例:

  • Chatbot(问答模式)

    • 你问:“番茄炒蛋怎么做?”
    • 它答:“第一步,打鸡蛋……第二步,切番茄……”
    • 结果:你得到了菜谱,但饭需要你自己做
  • Workflow(流水线模式)

    • 你按下一个按钮:“做番茄炒蛋”。
    • 预设流程:切菜机器人1号切番茄 → 搅拌机器人2号打鸡蛋 → 炒菜机器人3号按固定时间翻炒 → 装盘。
    • 结果:饭做好了,但每一步都是固定的。如果鸡蛋没了,整个流程就会卡死报错。
  • Agent(智能管家模式)

    • 你对一个全能管家说:“我饿了,做一顿晚餐。”
    • 它会自己思考:“冰箱里有什么?番茄、鸡蛋。我可以做番茄炒蛋。还需要米饭。” → 行动:查看电饭煲,发现米不够。 → 思考:“需要买米。” → 行动:打开生鲜 APP 下单。 → 等待米送到 → 行动:开始做饭。如果鸡蛋坏了,它会自动决定“改做番茄豆腐”。
    • 结果:饭做好了,而且过程中所有决策都是它自己做的。你只需要给出目标。
  • Multi-Agent(专业团队模式)

    • 你对团队说:“今晚举办一个10人的晚宴。”
    • 主厨 Agent:规划菜单(前菜、主菜、甜点)。
    • 采购 Agent:根据菜单去超市或电商平台采买。
    • 助理 Agent:洗菜、切菜、准备餐具。
    • 主厨 Agent:负责烹饪,并指挥助理递调料。
    • 品控 Agent:尝味道,建议加盐。
    • 结果:一桌丰盛的晚宴完成。分工协作让复杂任务变得高效可靠。

核心总结表

概念决策者流程工具使用复杂度典型应用
Chatbot用户 (完全由用户驱动)无,单轮/多轮对话客服、闲聊、问答
Workflow开发者 (预先编码)固定、确定性有,但调用方式固定RAG、数据处理、邮件自动回复
Agent大模型 (自主决策)动态、非确定性有,自主决定何时调用自动化订票、科研助手、个人助理
Multi-Agent多个Agent (分布式)涌现、协作/竞争各有工具,协作使用很高复杂软件开发、模拟社会、辩论系统

一句话记住:Chatbot靠问,Workflow靠编,Agent靠想,Multi-Agent靠聊。