G66 任务模块与测试场景Agent应用分析示例
Agent 可行性方案
系统模块
界面:任务面板、追踪HUD
(偏客户端表现)
逻辑:前置条件、
任务链、进度同步
(偏服务器)
表现:对话演出、
NPC头顶标记
业务线
相关
主线任务:剧情、
阶段推进、强制引导
支线/日常/周常:
任务池随机、次数上限
数值:奖励配置、
经验/货币产出
任务
流程
状态机:接取→
进行中→提交→完成
目标:击杀、采集、
到达、对话、护送
表现:完成动效、
奖励弹窗
服务器
逻辑
组队同步:
进度共享、离队处理
数据持久化:
掉线恢复、跨天重置
功能测试
冒烟/回归/兼容
客户端性能测试
服务端压测/协议
人工测试

(结构、框架是新增,没办法AI测试:

· 新增任务类型框架验证
· 任务系统与新玩法的
  首次集成联调
· UI交互细节走查
  (布局、动效、适配)
· 剧情演出质量主观评审
· 需求不明确/用例不规范
  的探索性测试

另外,可能需求不明确,
用例不规范)

QA:集成测试
程序:可以单元测试
SDD闭环了
TestAgent (VLM+POCO)
Bug Agent (Log+context+KB)
50%

· 任务面板UI元素校验
· NPC对话交互(视觉识别+点击)
· 任务追踪导航到达验证
· 任务完成弹窗表现验证
TestAgent (SDD-function call)
Bug Agent (基于视觉) 50%

· 击杀N只怪→进度→提交
· 采集M个物品→进度→提交
· 到达区域→触发完成
· 日常接取→完成→次日重置
· 放弃→重接→进度重置
TestAgent (SDD-function call)
Bug Agent (Log+context+KB)
80%

· 前置条件不满足→接取失败
· 背包满→奖励→邮件兜底
· 掉线重连→进度恢复
· 跨天→日常/周常重置
· 组队共享→离队→状态验证
· 活动到期→任务清理
· 老版本存档数据迁移
性能问题定位

Profile tools自动化分析
Tracy
90%
TestAgent
(脚本驱动)

· 大量任务列表
  滚动帧率
· 上限任务数
  内存占用
Bug Agent
(airperf
+context
+KB)
90%
· 任务面板打开/关闭帧率
· 追踪HUD常驻性能开销
· 快速接取/放弃稳定性
· 无缝切场景任务同步耗时
性能回归

TestAgent (SDD-protocol call)
Bug Agent for loadlab analysis
90%

· 批量模拟玩家同时接取
  任务的协议压测
· 高并发任务提交响应验证
· 日常重置时刻大量任务
  状态刷新压测
· 组队进度同步并发测试
· 跨服数据同步延迟测试
· 任务相关DB读写性能回归
人工测试
TestAgent (bot orchestration)
Bug Agent (Log+context+KB)
30%
· 任务系统与背包/装备/战斗/社交等系统的交叉影响验证
· 历史版本已有任务的大范围回归验证
· 服务器BOT长时间运行稳定性验证
70%
验证原有功能正常
🎯 G66 任务模块 · Agent 测试核心维度总结
🔬 测试核心 状态机驱动:接任务 → 完成条件 → 提交 → 领奖 → 触发下一个
对应GM指令链: mission 任务ID 1missionstep 任务ID 阶段 2missions 验证状态
📋 典型用例 自动化 任务链自动接取与流转验证   自动化 进度更新与同步检查   自动化 奖励发放正确性   自动化 断线恢复数据完整性
🛠️ Agent 策略 Step 1 GM跳前置:mission 任务ID 2 强制完成前置   Step 2 接/提交任务:missionstep 任务ID 阶段 状态   Step 3 查进度奖励:missions / !#p.bag_comp.bag_items
可覆盖 100% 任务逻辑流转(状态机全路径)  100% 条件判断(前置/等级/道具)  100% 奖励发放(道具/经验/货币)  100% 进度保存与恢复(掉线/跨天/跨周)
不可覆盖 人工 剧情对话演出表现   人工 过场动画播放效果   人工 "去XX地点"等地图寻路操作   人工 NPC头顶标记视觉效果
折中方案 折中 地图条件 → gotospace 场景ID + goto x y z 强制到位   折中 击杀/采集条件 → fmissionstep 任务ID 阶段 2 跳过   折中 剧情表现 → 留人工走查,Agent仅验证剧情触发的数据变更
Agent 路线说明:
Test Agent:以驱动游戏根据用例自主执行步骤为目标
- VLM+POCO:利用多模态大模型如Gemini 3.1识别界面,通过POCO驱动操作的方式。优势是灵活适应性强,缺点是效率较低、烧token

任务模块适用:任务面板UI操作、NPC对话点击、导航跟随验证
- SDD-function call:主要是借助SDD开发模式,封装一些可测试的有一定语义的组件,通过LLM的理解进行编排,形成执行序列或者是python脚本,驱动游戏执行。优势是执行效率高,缺点是需要程序配合封装接口,通用性弱一些

任务模块适用:任务全流程自动化(接取→击杀→采集→提交→验证奖励),是冒烟/回归的主力路线

G66 GM指令支撑:
mission/missionstep/fmissionstep
missions/manuals/gotospace/item
Bug Agent:
- 资源BUG检测:通过基于视觉的模型如seed进行时装皮肤的检测,通用性较强,但还是需要调优提示词

任务模块适用:任务面板UI异常、NPC标记显示异常、文字截断/重叠
- LOG+context+KB:就是通过执行时的各种日志,加上提示词上下文,以及产品知识库来做BUG分析,定位问题。这个agent实现简单,但强依赖项目组经验和skills加载

任务模块适用:任务流程报错日志分析、进度异常定位、奖励发放异常追踪
📌 G66 任务模块核心结论:

· 功能测试:0% Agent(新增框架)
· 冒烟/回归/兼容:80% Agent
· 客户端性能:~100% Agent
· 服务端压测:~100% Agent

任务流程 = 状态机,步骤明确、判定条件客观,是Agent自动化的理想场景

Agent核心策略:
GM跳前置 → 接/提交任务 → 查进度奖励
不可覆盖部分(剧情/地图)用GM折中