Agent 可行性方案
系统模块
界面:任务面板、
追踪HUD(偏客户端)
追踪HUD(偏客户端)
逻辑:前置条件、
任务链、进度同步
(偏服务器)
任务链、进度同步
(偏服务器)
表现:对话演出、
NPC头顶标记
NPC头顶标记
业务线
相关
相关
主线任务:剧情、
阶段推进、强制引导
阶段推进、强制引导
支线/日常/周常:
任务池随机、次数上限
任务池随机、次数上限
数值:奖励配置、
经验/货币产出
经验/货币产出
任务
流程
流程
状态机:接取→
进行中→提交→完成
进行中→提交→完成
目标:击杀、采集、
到达、对话、护送
到达、对话、护送
表现:完成动效、
奖励弹窗
奖励弹窗
服务器
逻辑
逻辑
组队同步:
进度共享、离队处理
进度共享、离队处理
数据持久化:
掉线恢复、跨天重置
掉线恢复、跨天重置
功能测试
冒烟/回归/兼容
客户端性能测试
服务端压测/协议
人工测试为主
Agent辅助:任务链路图自动生成
【15%】
任务链长、前置条件多,
断链问题需人工梳理:
· 新增任务类型框架验证
· 任务系统与新玩法的
首次集成联调
· UI交互细节走查
(布局、动效、适配)
· 剧情演出质量主观评审
· 断链问题人工排查
Agent从配置表自动生成
任务依赖图辅助排查
QA:集成+探索性测试
程序:单元测试可覆盖
SDD闭环
TestAgent (VLM+POCO)
主线流程回归
· 主线任务路径固定,
适合VLM+POCO回归
· 任务面板UI元素校验
· NPC对话交互
(视觉识别+点击)
· 任务追踪导航到达验证
· 任务完成弹窗表现验证
TestAgent (SDD-func call)
条件校验
· 任务完成条件用SDD
直接校验(如杀怪数/
采集数)
· 击杀N只怪→进度→提交
· 采集M个物品→进度→提交
· 到达区域→触发完成
· 日常接取→完成→次日重置
BugAgent (Log+ctx+KB)
45%
· 前置条件不满足→接取失败
· 背包满→奖励→邮件兜底
· 掉线重连→进度恢复
· 跨天→日常/周常重置
· 组队共享→离队→状态验证
· 活动到期→任务清理
脚本驱动(跑图+交互)
任务引导场景涉及大量
加载和场景切换,
容易出性能问题
55%
TestAgent
(脚本驱动
跑图+交互)
(脚本驱动
跑图+交互)
· 任务引导场景
加载耗时
· 场景切换
帧率采集
· 大量任务列表
滚动帧率
BugAgent
(airperf
+ctx
+KB)
(airperf
+ctx
+KB)
55%
· 任务面板打开/关闭帧率
· 追踪HUD常驻性能开销
· 快速接取/放弃稳定性
· 无缝切场景任务同步耗时
⚠️ 任务引导涉及大量加载
和场景切换,容易出
性能问题
· 追踪HUD常驻性能开销
· 快速接取/放弃稳定性
· 无缝切场景任务同步耗时
⚠️ 任务引导涉及大量加载
和场景切换,容易出
性能问题
SDD-protocol
(批量接取/完成)
BugAgent: loadlab analysis
60%
· 大量玩家同时做同一任务
(如赛季开服),验证
任务进度存储的并发安全
· 批量模拟玩家同时接取
任务的协议压测
· 高并发任务提交响应验证
· 日常重置时刻大量任务
状态刷新压测
· 组队进度同步并发测试
· 任务相关DB读写性能回归
⚠️ 赛季开服大量玩家
同时做同一任务,
需验证进度存储并发安全
人工测试
TestAgent (bot orchestration)
Bug Agent (Log+context+KB)
30%
Bug Agent (Log+context+KB)
30%
· 任务系统与背包/装备/战斗/社交等系统的交叉影响验证
· 历史版本已有任务的大范围回归验证
· 服务器BOT长时间运行稳定性验证
70%
· 历史版本已有任务的大范围回归验证
· 服务器BOT长时间运行稳定性验证
70%
↑
验证原有功能正常
🎯 G66 ⑦任务系统 · Agent 测试核心维度总结
| 🔬 测试核心 | 状态机驱动:接任务 → 完成条件 → 提交 → 领奖 → 触发下一个 对应GM指令链: mission 任务ID 1 → missionstep 任务ID 阶段 2 → missions 验证状态 |
|---|---|
| 📋 典型用例 | 自动化 主线任务路径回归(VLM+POCO) 自动化 完成条件校验(SDD-func call:杀怪数/采集数) 自动化 任务链路图自动生成(配置表解析) 自动化 赛季开服并发安全(SDD-protocol) |
| 🛠️ Agent 策略 | Step 1 GM跳前置:mission 任务ID 2 强制完成前置 Step 2 接/提交任务:missionstep 任务ID 阶段 状态 Step 3 SDD条件校验:杀怪数/采集数直接验证 Step 4 查进度奖励:missions / !#p.bag_comp.bag_items |
| ✅ 可覆盖 | VLM+POCO 主线路径固定,回归测试 SDD-func 任务完成条件校验(杀怪数/采集数) SDD-protocol 批量接取/完成并发压测 airperf 任务引导场景加载性能采集 |
| ❌ 不可覆盖 | 人工 任务链断链问题排查(链长、前置条件多) 人工 剧情对话演出表现 人工 过场动画播放效果 人工 NPC头顶标记视觉效果 人工 分支任务探索性测试 |
| ⚡ 折中方案 | 折中 断链排查 → Agent从配置表自动生成任务依赖图辅助排查 折中 地图条件 → gotospace 场景ID + goto x y z 强制到位 折中 击杀/采集条件 → fmissionstep 任务ID 阶段 2 跳过 折中 剧情表现 → 留人工走查,Agent仅验证剧情触发的数据变更 |
Agent 路线说明:
Test Agent:以驱动游戏根据用例自主执行步骤为目标
- VLM+POCO(主线流程回归):主线任务路径固定,适合VLM+POCO跑回归测试
任务模块适用:任务面板UI操作、NPC对话点击、导航跟随验证、主线流程回归
任务模块适用:任务面板UI操作、NPC对话点击、导航跟随验证、主线流程回归
- SDD-func call(条件校验):任务完成条件用SDD直接校验(如杀怪数/采集数),高效验证任务逻辑
任务模块适用:任务完成条件直接校验(杀怪数/采集数/到达区域),是冒烟/回归的主力路线
G66 GM指令支撑:
mission/missionstep/fmissionstep
missions/manuals/gotospace/item
任务模块适用:任务完成条件直接校验(杀怪数/采集数/到达区域),是冒烟/回归的主力路线
G66 GM指令支撑:
mission/missionstep/fmissionstep
missions/manuals/gotospace/item
- SDD-protocol(批量接取/完成):协议层面模拟大量玩家同时做任务
任务模块适用:赛季开服大量玩家同时做同一任务,验证进度存储并发安全
任务模块适用:赛季开服大量玩家同时做同一任务,验证进度存储并发安全
Bug Agent:
- LOG+ctx+KB:通过执行时日志+上下文+知识库做BUG分析定位
任务模块适用:任务流程报错日志分析、进度异常定位、奖励发放异常追踪
任务模块适用:任务流程报错日志分析、进度异常定位、奖励发放异常追踪
- airperf+ctx+KB:性能数据采集与自动分析
任务模块适用:任务引导场景涉及大量加载和场景切换,自动采集帧率/内存数据
任务模块适用:任务引导场景涉及大量加载和场景切换,自动采集帧率/内存数据
- loadlab analysis:压测工具分析服务端性能瓶颈
任务模块适用:批量接取/完成任务的协议压力、进度存储并发安全验证
任务模块适用:批量接取/完成任务的协议压力、进度存储并发安全验证
📌 G66 ⑦任务系统核心结论(ROADMAP数据):
· 功能测试:15% Agent(任务链路图自动生成)
· 冒烟/回归/兼容:45% Agent
· 客户端性能:55% Agent
· 服务端压测:60% Agent
主线路径固定适合VLM+POCO回归;完成条件用SDD直接校验;赛季开服需验证并发安全
Agent核心策略:
VLM+POCO主线回归 + SDD条件校验 + 配置表依赖图
断链/剧情/分支仍靠人工
· 功能测试:15% Agent(任务链路图自动生成)
· 冒烟/回归/兼容:45% Agent
· 客户端性能:55% Agent
· 服务端压测:60% Agent
主线路径固定适合VLM+POCO回归;完成条件用SDD直接校验;赛季开服需验证并发安全
Agent核心策略:
VLM+POCO主线回归 + SDD条件校验 + 配置表依赖图
断链/剧情/分支仍靠人工
💡 建议:跟程序约定每个新活动提测时,同步提供该活动涉及的接口清单和参数说明。这本身也是 SDD 的一部分。