上个月密集面了字节、腾讯、阿里三家 Agent 开发岗。
一个很真实的感受:同样一个问题,三家的追问方向完全不一样。字节盯着训练流程追问三层,腾讯拉着你聊协议设计聊了半小时,阿里则是从架构选型一路挖到落地瓶颈。
我以为准备充分了,结果每家都踩了不同的坑。
这不是个例。
2026 年,Agent 开发岗已经取代传统前后端,成为大厂 AI 方向的主力招聘方向。但一个残酷的现实是:
三家大厂对 Agent 的理解和考核方向,根本不一样。
今天,我把字节、腾讯、阿里 2026 年最新面经整理出来,按厂拆解。
一、字节跳动:从训练原理到工程异常,一个都不放过
字节的 Agent 面试,是三家里技术密度最高的。
必考题 1:ReAct 框架的工程实现
面试官不会问你”ReAct 是什么”,而是直接追问实现细节:
“你的 ReAct 循环里,消息格式怎么设计的?tool_response 用 user 角色还是 assistant 角色传回?为什么?”
满分回答:tool_response 用 user 角色传回。因为它是外部系统返回的内容,不是模型生成的。放在 user 角色下符合对话轮次的语义逻辑。如果放 assistant 角色,模型会以为自己”说”了这些话,导致后续推理混乱。
完整消息结构:
system → 工具列表 + 输出规范
assistant → <think>推理</think> + <tool_call>{"name":"search","args":{}}</tool_call>
user → <tool_response>搜索结果</tool_response>
assistant → <think>继续推理</think> → <answer>最终答案</answer>
必考题 2:Agentic CPT → SFT → RL 三阶段训练
这是字节的高频难点,考察你对 Agent 训练流程的理解深度:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
面试官最常追问的:为什么 SFT 时要 mask observation tokens?
因为 observation 是外部结果,不是模型生成的。如果对 observation 算 loss,模型会试图”学习”预测搜索结果,这既不可能也没意义。
必考题 3:你的 Agent 死循环了怎么办?
字节面试官有一道经典追问:
“你的 Agent 调了三个工具就死循环了,异常处理在哪写的?”
这题考的不只是技术 —— 它考你有没有真正跑过生产级别的 Agent。
答案要点:
-
1. Max Iteration Limit(硬限制) -
2. Loop Detection(检测重复的 tool_call 模式) -
3. 异常回退策略:重试→降级→人工介入
二、腾讯:从协议标准到工程落地,处处是坑
腾讯的风格更偏”工程协议通才”。面试官关心的是:你对 Agent 生态的理解有多广。
必考题 1:Workflow 和 Agent 到底有什么区别?
腾讯面试官会这样问:
“你做了三个月 Agent,那你告诉我 Workflow 和 Agent 本质区别是什么?”
这是腾讯最高频的区分题:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
面试官想听的: Workflow 是”规定动作”,Agent 是”自由体操”。两者的最佳实践是组合使用——用 Workflow 兜底,用 Agent 处理异常。
必考题 2:MCP 和 A2A 你了解多少?
腾讯面试官会质疑你的工程视野:
“Agent 不就是 LLM 加点工具?那 MCP 是什么?A2A 呢?Skills 和 Function Call 又有什么区别?”
2026 年的标准答案:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
必考题 3:Agent 的记忆机制怎么设计?
腾讯对 Memory 的考察非常系统:
-
• 短期记忆 = 上下文窗口(Messages List) -
• 长期记忆 = 向量库 + RAG -
• 上下文超出限制怎么办?→ 滑动窗口 vs ReSum 动态摘要 -
• Context Window 的载入方式是什么?→ Messages List 才是真实记忆的根本机制
三、阿里巴巴:从架构设计到业务落地,一步不能少
阿里的风格是”既要又要还要”。面试官既考架构格局,又扣落地细节。
必考题 1:Tools、Workflow、Agent 三者的区别
阿里一面这道题几乎必出:
“连 Tools、Workflow 和 Agent 三者区别都搞不清,也敢来面试?”
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
关键洞察: Tools 是零件,Workflow 是流水线,Agent 是能换流水线的机器人。
必考题 2:Multi-Agent 三层架构
阿里面试官要求你画出 Multi-Agent 架构图:
Router Agent(路由层)
↓
Manager Agent(管理层)
↓
Sub-Agent(执行层):搜索Agent / 分析Agent / 写作Agent
追问点:
-
• Agent 之间怎么通信?→ A2A 协议 -
• 死锁/死循环怎么避免?→ 超时 + 心跳 + 终止信号 -
• 结果怎么聚合?→ 投票 / 权威仲裁 / 分层汇总
必考题 3:Agent 落地瓶颈
阿里面试官比较务实,会直接问:
“你做了这么多 Agent 项目,说说落地最大的三个瓶颈。”
2026 年的高频答案:
-
1. 推理断层 — 多步推理中信息丢失,上下文管理是核心 -
2. 结果对齐 — Agent 自主决策与业务规则冲突 -
3. 可观测性 — Agent 决策过程黑盒,排查问题困难
四、三厂对比:你在准备谁家的面试?
|
|
|
|
|
|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
备考建议:
面字节: 重点准备 ReAct 工程实现、Agent 训练流程(CPT→SFT→RL)、异常处理。手写一个最简 ReAct Agent,不依赖框架,从 prompt 设计到 tool_call 解析到 tool_response 回传,完整跑一遍。
面腾讯: 重点准备 MCP/A2A/Skills 等协议理解、Workflow vs Agent 概念对比、Memory 机制设计。把 Agent 生态中的每个概念都挖到”能讲清楚差异”的深度。
面阿里: 重点准备 Tools/Workflow/Agent 层次区分、Multi-Agent 架构设计、落地瓶颈分析。用阿里最爱的”分层思维”回答问题——从底层到顶层逐步展开。
最后说一句
2026 年的 Agent 面试,已经从”你会调 API”进化到了”你能构建稳定、可观测、可落地的 Agent 系统”。
这不是一篇文章能讲完的。三家的面试题如果展开,每家的题量都够写一个系列。
但有一条通用建议:
不要只背概念。手写一个 ReAct 循环,不依赖任何框架。从 system prompt 设计到 tool_call 解析,完整跑通一遍。
三面的技术面都跑不出这个范围。
本文来自转载AgentAlpha创客星球 ,不代表发现AI立场,如若转载,请联系原作者;如有侵权,请联系编辑删除。

微信扫一扫

