字节/腾讯/阿里 Agent 开发岗面试题横评：三家在考什么，我面完才明白

上个月密集面了字节、腾讯、阿里三家 Agent 开发岗。

一个很真实的感受：同样一个问题，三家的追问方向完全不一样。字节盯着训练流程追问三层，腾讯拉着你聊协议设计聊了半小时，阿里则是从架构选型一路挖到落地瓶颈。

我以为准备充分了，结果每家都踩了不同的坑。

这不是个例。

2026 年，Agent 开发岗已经取代传统前后端，成为大厂 AI 方向的主力招聘方向。但一个残酷的现实是：

三家大厂对 Agent 的理解和考核方向，根本不一样。

今天，我把字节、腾讯、阿里 2026 年最新面经整理出来，按厂拆解。

一、字节跳动：从训练原理到工程异常，一个都不放过

字节的 Agent 面试，是三家里技术密度最高的。

必考题 1：ReAct 框架的工程实现

面试官不会问你”ReAct 是什么”，而是直接追问实现细节：

“你的 ReAct 循环里，消息格式怎么设计的？tool_response 用 user 角色还是 assistant 角色传回？为什么？”

满分回答：tool_response 用 user 角色传回。因为它是外部系统返回的内容，不是模型生成的。放在 user 角色下符合对话轮次的语义逻辑。如果放 assistant 角色，模型会以为自己”说”了这些话，导致后续推理混乱。

完整消息结构：

system → 工具列表 + 输出规范
assistant → <think>推理</think> + <tool_call>{"name":"search","args":{}}</tool_call>
user → <tool_response>搜索结果</tool_response>
assistant → <think>继续推理</think> → <answer>最终答案</answer>

必考题 2：Agentic CPT → SFT → RL 三阶段训练

这是字节的高频难点，考察你对 Agent 训练流程的理解深度：

阶段	数据量	做什么
Agentic CPT	~300B tokens	预训练注入 Agent 先验（可选）
SFT 冷启动	2K-10K 条轨迹	只对 think/tool_call/answer 计算 loss
RL（GRPO）	自探索	让模型自主探索，奖励函数驱动

面试官最常追问的：为什么 SFT 时要 mask observation tokens？

因为 observation 是外部结果，不是模型生成的。如果对 observation 算 loss，模型会试图”学习”预测搜索结果，这既不可能也没意义。

必考题 3：你的 Agent 死循环了怎么办？

字节面试官有一道经典追问：

“你的 Agent 调了三个工具就死循环了，异常处理在哪写的？”

这题考的不只是技术 —— 它考你有没有真正跑过生产级别的 Agent。

答案要点：

1. Max Iteration Limit（硬限制）
2. Loop Detection（检测重复的 tool_call 模式）
3. 异常回退策略：重试→降级→人工介入

二、腾讯：从协议标准到工程落地，处处是坑

腾讯的风格更偏”工程协议通才”。面试官关心的是：你对 Agent 生态的理解有多广。

必考题 1：Workflow 和 Agent 到底有什么区别？

腾讯面试官会这样问：

“你做了三个月 Agent，那你告诉我 Workflow 和 Agent 本质区别是什么？”

这是腾讯最高频的区分题：

	Workflow	Agent
控制流	代码确定	LLM 自主
灵活性	固定路径	动态决策
适用场景	标准操作	复杂推理
可预测性	高	低

面试官想听的： Workflow 是”规定动作”，Agent 是”自由体操”。两者的最佳实践是组合使用——用 Workflow 兜底，用 Agent 处理异常。

必考题 2：MCP 和 A2A 你了解多少？

腾讯面试官会质疑你的工程视野：

“Agent 不就是 LLM 加点工具？那 MCP 是什么？A2A 呢？Skills 和 Function Call 又有什么区别？”

2026 年的标准答案：

概念	本质	类比
Function Call	模型输出 JSON 调用格式	螺丝刀
MCP	标准化工具连接协议	USB-C 接口
Skills	自然语言指令教 Agent”怎么做”	使用说明书
A2A	Agent 间通信协议	HTTP 协议

必考题 3：Agent 的记忆机制怎么设计？

腾讯对 Memory 的考察非常系统：

• 短期记忆 = 上下文窗口（Messages List）
• 长期记忆 = 向量库 + RAG
• 上下文超出限制怎么办？→ 滑动窗口 vs ReSum 动态摘要
• Context Window 的载入方式是什么？→ Messages List 才是真实记忆的根本机制

三、阿里巴巴：从架构设计到业务落地，一步不能少

阿里的风格是”既要又要还要”。面试官既考架构格局，又扣落地细节。

必考题 1：Tools、Workflow、Agent 三者的区别

阿里一面这道题几乎必出：

“连 Tools、Workflow 和 Agent 三者区别都搞不清，也敢来面试？”

层次	能力	例子
Tools	原子能力	搜索、计算、写文件
Workflow	编排流程	先搜索→再分析→最后输出
Agent	自主决策	根据目标自己决定怎么走

关键洞察： Tools 是零件，Workflow 是流水线，Agent 是能换流水线的机器人。

必考题 2：Multi-Agent 三层架构

阿里面试官要求你画出 Multi-Agent 架构图：

Router Agent（路由层）
    ↓
Manager Agent（管理层）
    ↓
Sub-Agent（执行层）：搜索Agent / 分析Agent / 写作Agent

追问点：

• Agent 之间怎么通信？→ A2A 协议
• 死锁/死循环怎么避免？→ 超时 + 心跳 + 终止信号
• 结果怎么聚合？→ 投票 / 权威仲裁 / 分层汇总

必考题 3：Agent 落地瓶颈

阿里面试官比较务实，会直接问：

“你做了这么多 Agent 项目，说说落地最大的三个瓶颈。”

2026 年的高频答案：

1. 推理断层 — 多步推理中信息丢失，上下文管理是核心
2. 结果对齐 — Agent 自主决策与业务规则冲突
3. 可观测性 — Agent 决策过程黑盒，排查问题困难

四、三厂对比：你在准备谁家的面试？

维度	字节跳动	腾讯	阿里巴巴
技术密度	★★★★★	★★★★	★★★★
协议广度	★★★	★★★★★	★★★★
架构深度	★★★★	★★★	★★★★★
工程落地	★★★★★	★★★★	★★★★★
高频追问	训练流程异常处理	MCP/A2A/Skills	Tools/Workflow/Agent 区别