G66 任务模块与测试场景Agent应用分析示例

功能测试

冒烟/回归/兼容

客户端性能测试

服务端压测/协议

人工测试

（结构、框架是新增，没办法AI测试：

· 新增任务类型框架验证
· 任务系统与新玩法的
  首次集成联调
· UI交互细节走查
  （布局、动效、适配）
· 剧情演出质量主观评审
· 需求不明确/用例不规范
  的探索性测试

另外，可能需求不明确，
用例不规范）

QA：集成测试
程序：可以单元测试
SDD闭环了

TestAgent (VLM+POCO)

Bug Agent (Log+context+KB)

50%

· 任务面板UI元素校验
· NPC对话交互（视觉识别+点击）
· 任务追踪导航到达验证
· 任务完成弹窗表现验证

TestAgent (SDD-function call)

Bug Agent (基于视觉) 50%

· 击杀N只怪→进度→提交
· 采集M个物品→进度→提交
· 到达区域→触发完成
· 日常接取→完成→次日重置
· 放弃→重接→进度重置

TestAgent (SDD-function call)

Bug Agent (Log+context+KB)

80%

· 前置条件不满足→接取失败
· 背包满→奖励→邮件兜底
· 掉线重连→进度恢复
· 跨天→日常/周常重置
· 组队共享→离队→状态验证
· 活动到期→任务清理
· 老版本存档数据迁移

性能问题定位

Profile tools自动化分析
Tracy

90%

TestAgent
(脚本驱动)

· 大量任务列表
滚动帧率
· 上限任务数
内存占用

Bug Agent
(airperf
+context
+KB)

90%

· 任务面板打开/关闭帧率
· 追踪HUD常驻性能开销
· 快速接取/放弃稳定性
· 无缝切场景任务同步耗时

性能回归

TestAgent (SDD-protocol call)

Bug Agent for loadlab analysis

90%

· 批量模拟玩家同时接取
任务的协议压测
· 高并发任务提交响应验证
· 日常重置时刻大量任务
状态刷新压测
· 组队进度同步并发测试
· 跨服数据同步延迟测试
· 任务相关DB读写性能回归

人工测试

TestAgent (bot orchestration)
Bug Agent (Log+context+KB)
30%

· 任务系统与背包/装备/战斗/社交等系统的交叉影响验证
· 历史版本已有任务的大范围回归验证
· 服务器BOT长时间运行稳定性验证
70%

↑

验证原有功能正常

🎯 G66 任务模块 · Agent 测试核心维度总结

🔬 测试核心	状态机驱动：接任务 → 完成条件 → 提交 → 领奖 → 触发下一个对应GM指令链： mission 任务ID 1 → missionstep 任务ID 阶段 2 → missions 验证状态
📋 典型用例	自动化任务链自动接取与流转验证自动化进度更新与同步检查自动化奖励发放正确性自动化断线恢复数据完整性
🛠️ Agent 策略	Step 1 GM跳前置：mission 任务ID 2 强制完成前置 Step 2 接/提交任务：missionstep 任务ID 阶段状态 Step 3 查进度奖励：missions / !#p.bag_comp.bag_items
✅ 可覆盖	100% 任务逻辑流转（状态机全路径） 100% 条件判断（前置/等级/道具） 100% 奖励发放（道具/经验/货币） 100% 进度保存与恢复（掉线/跨天/跨周）
❌ 不可覆盖	人工剧情对话演出表现人工过场动画播放效果人工 "去XX地点"等地图寻路操作人工 NPC头顶标记视觉效果
⚡ 折中方案	折中地图条件 → gotospace 场景ID + goto x y z 强制到位折中击杀/采集条件 → fmissionstep 任务ID 阶段 2 跳过折中剧情表现 → 留人工走查，Agent仅验证剧情触发的数据变更

Agent 路线说明：

Test Agent：以驱动游戏根据用例自主执行步骤为目标

- VLM+POCO：利用多模态大模型如Gemini 3.1识别界面，通过POCO驱动操作的方式。优势是灵活适应性强，缺点是效率较低、烧token

任务模块适用：任务面板UI操作、NPC对话点击、导航跟随验证

- SDD-function call：主要是借助SDD开发模式，封装一些可测试的有一定语义的组件，通过LLM的理解进行编排，形成执行序列或者是python脚本，驱动游戏执行。优势是执行效率高，缺点是需要程序配合封装接口，通用性弱一些

任务模块适用：任务全流程自动化（接取→击杀→采集→提交→验证奖励），是冒烟/回归的主力路线

G66 GM指令支撑：
mission/missionstep/fmissionstep
missions/manuals/gotospace/item

Bug Agent：

- 资源BUG检测：通过基于视觉的模型如seed进行时装皮肤的检测，通用性较强，但还是需要调优提示词

任务模块适用：任务面板UI异常、NPC标记显示异常、文字截断/重叠

- LOG+context+KB：就是通过执行时的各种日志，加上提示词上下文，以及产品知识库来做BUG分析，定位问题。这个agent实现简单，但强依赖项目组经验和skills加载

任务模块适用：任务流程报错日志分析、进度异常定位、奖励发放异常追踪

📌 G66 任务模块核心结论：

· 功能测试：0% Agent（新增框架）
· 冒烟/回归/兼容：80% Agent
· 客户端性能：~100% Agent
· 服务端压测：~100% Agent

任务流程 = 状态机，步骤明确、判定条件客观，是Agent自动化的理想场景

Agent核心策略：
GM跳前置 → 接/提交任务 → 查进度奖励
不可覆盖部分（剧情/地图）用GM折中