第三方智能体面试题
这部分面试别背定义,尽量按这条线回答:
它是什么 -> 解决什么问题 -> 和别的工具有什么区别 -> 为什么选它
下面我尽量用白话讲,碰到专业词时会顺手补一句人话。
一、平台定位
1. Coze 是什么?适合做什么?
我一般会说,Coze 是一个上手比较快的智能体搭建平台,适合先把一个能用的机器人做出来,再慢慢补能力。
比如做一个电商客服机器人,用户问“这单什么时候发货”,它先判断这是查物流问题,再去知识库里找发货规则,同时调物流接口查最新状态。最后它会把“已发货、当前到哪一站、预计多久到”这类信息直接回给用户;如果查不到单号,就继续追问订单号,而不是胡乱回答。
它最适合的场景是:
- 业务方快速验证想法
- 客服、运营、售后这类标准化场景
- 需要尽快上线、尽快出效果的项目
2. Dify 是什么?和 Coze 有什么区别?
Dify 我会理解成一个偏工程化、能自己部署的智能体平台。它的核心就是把流程画出来,接上工具和数据源,再把 AI 应用跑起来。
比如做一个请假审批助手,员工发“我想请 3 天年假”,系统先判断这是请假申请,再查当前年假余额和部门规则。如果额度够,就自动生成审批单;如果不够,就提示还差多少天,或者让员工改成事假。
和 Coze 比,Dify 更偏:
- 自己部署
- 流程编排
- 知识库检索
- 看日志、看过程
- 通过接口给别的平台用
如果是企业内复杂流程、私有化部署、强集成,Dify 通常更顺手。
3. OpenClaw 是什么?和前两个有什么不同?
OpenClaw 更像一个自己部署的消息网关,把聊天渠道和 AI agent 连起来。它不是单纯的聊天机器人,而是“消息入口 + 执行层”。
比如把飞书、Slack、WhatsApp 的消息统一接进来,用户在飞书里发“查订单 12345”,系统先识别这个人是谁,再把消息路由到售后 agent;同样的逻辑也能跑在 Slack 和 WhatsApp 上。这样不管用户从哪个入口进来,最后拿到的结果都一致。
它的特点是:
- 自己部署,数据和控制权在自己手里
- 多渠道接入
- 会话、记忆、路由是核心能力
- 更偏重度用户和开发者
如果说 Coze、Dify 更像“搭应用的平台”,OpenClaw 更像“把 agent 真正跑起来的消息网关”。
二、搭建流程
1. Coze 的搭建流程
我一般按“先做出一个能聊天的机器人,再一点点加能力”来搭。
- 新建一个 Bot,先把角色说清楚:它是谁、做什么、不能做什么。
- 先接一个模型,让它能正常回答。
- 把常见资料放进知识库,比如产品说明、FAQ、售后规则。
- 需要查数据的,就接插件或工具,比如查订单、查物流、查商品。
- 需要固定步骤的,就加工作流,比如“先识别意图,再查订单,再判断能不能退”。
- 在测试里多问几轮,看看会不会答偏。
- 没问题后,再发布到网页、飞书、微信这类渠道。
对我来说,Coze 的好处就是快,适合先跑通一个原型。
2. Dify 的搭建流程
Dify 我通常按“先把流程画清楚,再把能力补齐”来做。
- 先新建应用。
- 简单问答就选 Chatflow,复杂步骤就选 Workflow。
- 配好模型和密钥,让应用先能跑起来。
- 接知识库,把规则、说明文档、业务资料放进去。
- 把外部接口做成工具,比如查订单、查库存、查退款状态。
- 在画布里把流程串起来,比如:开场 -> 判断问题类型 -> 查知识库/查工具 -> 生成答案 -> 兜底。
- 用日志看每一步有没有跑偏,再不断调整。
- 最后发布成网页、接口,或者给别的平台调用。
Dify 的好处是流程比较清楚,适合团队一起协作,也适合自己部署。
3. OpenClaw 的搭建流程
OpenClaw 我会按“先把中间网关跑起来,再接聊天渠道和智能体”来理解。
- 先安装并启动 Gateway,它相当于总开关。
- 配模型和 API Key,让它知道去哪里调用大模型。
- 接聊天渠道,比如 Telegram、Slack、WhatsApp、飞书等。
- 打开控制台,看会话、日志和配置。
- 配记忆和路由,比如每个用户一份会话,或者不同场景走不同 agent。
- 注册工具或技能,让 agent 能查资料、调接口、看状态。
- 加好白名单和权限,避免乱接消息。
- 先小范围试跑,再正式上线。
OpenClaw 更适合想把控制权放在自己手里的人,尤其适合消息很多、渠道很多、还想统一管理会话的场景。
三、和 Spring AI / LangChain4j 的关系
4. 第三方智能体平台,和 Spring AI / LangChain4j 这种框架有什么区别?
我一般会这样区分:
- Spring AI / LangChain4j:偏底层开发框架,核心是把大模型接进 Java 项目,做提示词、工具调用、知识库、记忆、结构化输出这些能力
- Coze / Dify / OpenClaw:偏上层平台,核心是把这些能力画成流程,顺手把机器人、知识库、发布、监控也一起做了
简单说,框架解决的是“怎么接模型、怎么写逻辑”,平台解决的是“怎么更快搭出一个能跑的智能体应用”。
比如在 Java 电商系统里,Spring AI / LangChain4j 可以让后端先判断用户是不是在问退款。判断完以后,再去调订单接口看这单有没有发货,调退款接口看是否超时,调库存接口看商品是不是已经拆封,最后再按公司规则拼出一段自然语言回复给用户。
5. 它们之间是替代关系,还是互补关系?
我会说是互补,不是绝对替代。
如果你用 Spring AI 或 LangChain4j,自由度更高,适合:
- 深度集成现有 Java 系统
- 复杂权限和业务流程
- 强定制的工具链
- 需要完全掌控代码和部署
如果你用 Coze、Dify 这类平台,优点是:
- 上手快
- 流程可视化
- 业务同学也能参与
- 适合快速验证和快速交付
6. 什么时候先用平台,什么时候直接用框架?
我一般这样答:
- 先用平台:需求还不稳定、想快速验证、业务规则会频繁变化
- 直接用框架:核心能力要沉淀到自有系统里、对安全和扩展要求高、要和 Java 业务深度耦合
更现实的做法通常是:
- 先用 Coze / Dify 跑通原型
- 再把核心链路迁到 Spring AI / LangChain4j
- 把平台当验证工具,把框架当长期工程化方案
四、工作流与知识库
4. 为什么智能体不能只靠大模型,要加工作流?
因为纯靠大模型很容易胡编。
工作流的价值是把流程固定住,比如:
- 先识别意图
- 再查订单或查知识库
- 再调工具
- 最后做兜底或转人工
这样能减少胡编,也能让结果更稳定。
5. Dify 里的 Workflow 和 Chatflow 怎么区分?
我会这么答:
Chatflow更偏对话体验,强调一轮轮问答Workflow更偏流程编排,强调节点控制和状态流转
如果是客服问答、标准流程,Chatflow 很合适;如果是审批、检索、调用多个工具的复杂链路,Workflow 更适合。
6. 知识库为什么能提升准确率?怎么做才更稳?
知识库的作用是让 AI 先查再答,而不是凭感觉回答。
我通常会从四个点答:
- 切分要合理,别一大段全塞进去
- 元数据要加好,比如类目、场景、版本
- 检索时先缩小范围,再召回
- 必要时加 rerank(再排一遍顺序)或者固定问答兜底
这样能明显提升召回和回答一致性。
7. Annotation / 固定问答有什么用?
它适合高频、标准、不能答错的问题。
比如:
- 退款时效
- 发货规则
- 运费险规则
- 售后政策
这种问题命中固定问答后直接返回,比让模型重新生成更稳。
五、工具与多轮对话
8. 工具调用怎么理解?
工具调用本质上是让 AI 不要瞎猜,而是去调用真实系统拿结果。
比如:
- 查订单
- 查物流
- 查商品类目
- 查退款状态
面试里我会强调一句:工具负责真实数据,大模型负责理解和组织语言。
9. 多轮对话里,上下文怎么保存?
我一般会说,至少要存这些东西:
userIdsessionIdorderNoproductId- 当前状态
- 最近几轮关键上下文
重点不是全量保存,而是保存“后续还会用到的关键字段”,这样下一轮才能接着聊。
10. OpenClaw 的“多渠道 + 会话 + 记忆”有什么意义?
它的意义是把一个 agent 放到真实的聊天和工作流里。
官方文档里强调的是:
- 一个 Gateway 可以连多个渠道
- 会话和路由是统一管理的
- 支持 per-sender session 和 memory
- 可以走多 agent 路由
这意味着它更适合做持续运行、持续记忆的个人或团队助手。
11. OpenClaw 的安全风险怎么回答?
我会直接说它的风险比普通聊天应用更高,因为它会接触账号、会话、文件、渠道和工具。
所以面试时要提这几个点:
- 最小权限
- 白名单
- 隔离运行
- 审计日志
- 第三方插件/技能要审查
一句话总结就是:Agent 越自动化,越要把安全边界说清楚。
六、选型与追问
12. 如果业务方要尽快落地,你怎么选 Coze、Dify、OpenClaw、Spring AI、LangChain4j?
我的选型一般是:
- 要快、要业务同学能参与,优先 Coze
- 要工程化、可观测、可私有化,优先 Dify
- 要消息网关、自己部署、强自动化,优先 OpenClaw
- 要把能力直接写进 Java 系统里,优先 Spring AI / LangChain4j
如果面试官继续追问,我会补一句:选型不看“谁更强”,看的是“谁最符合交付路径”。
13. 第三方平台和 Spring AI / LangChain4j 这种框架,到底有什么区别?
我一般会这么答:
- 第三方平台:像 Coze、Dify、OpenClaw,更像现成的搭建台,流程、知识库、工具、发布很多都帮你准备好了,适合快
- 框架方案:像 Spring AI、LangChain4j,更像开发积木,代码控制力更强,适合深度接 Java 业务
简单说,平台更适合“先跑出来”,框架更适合“长期沉淀到自己的系统里”。
14. Spring AI / LangChain4j 能不能调用第三方智能体?
能。更准确地说,是把第三方智能体当成一个外部服务来调用,不是把它当成本地代码直接跑。
我一般会分三种情况说:
- 第三方智能体有开放接口
- 直接通过 HTTP 或 SDK 调用
- 在 Spring AI / LangChain4j 里封装成一个工具就行
- 第三方智能体支持 Webhook、MCP 或统一接口
- 也可以接
- 本质还是“发请求 -> 拿结果”
- 第三方智能体只有网页,没有接口
- 那就不适合正式集成
- 只能走模拟操作,不建议作为主方案
我会把它总结成一句话:框架负责编排,第三方智能体负责完成某一段现成能力,两者可以联动。
15. 智能体和普通聊天机器人有什么区别?
聊天机器人主要是“回答问题”。
智能体除了回答,还要能:
- 记忆上下文
- 调工具
- 跑流程
- 做多轮决策
- 在不同渠道持续工作
这就是它和普通 Chatbot 的核心区别。
16. 为什么第三方平台不能完全替代 Spring AI / LangChain4j 这种框架方案?
因为第三方平台适合快速验证,但核心业务还是要自己控制。
我一般会答:
- 第三方平台负责提速
- 框架方案负责沉淀业务能力
- 核心规则、数据、权限、审计最好还是掌握在自己手里
所以更现实的做法不是二选一,而是“先用平台跑通,再把核心能力沉淀到自有体系里”。
七、参考
- Coze: https://www.coze.com/
- Dify Docs: https://docs.dify.ai/
- OpenClaw Docs: https://docs.openclaw.ai/