Agent 可行性方案
系统模块
界面:任务面板、追踪HUD
(偏客户端表现)
(偏客户端表现)
逻辑:前置条件、
任务链、进度同步
(偏服务器)
任务链、进度同步
(偏服务器)
表现:对话演出、
NPC头顶标记
NPC头顶标记
业务线
相关
相关
主线任务:剧情、
阶段推进、强制引导
阶段推进、强制引导
支线/日常/周常:
任务池随机、次数上限
任务池随机、次数上限
数值:奖励配置、
经验/货币产出
经验/货币产出
任务
流程
流程
状态机:接取→
进行中→提交→完成
进行中→提交→完成
目标:击杀、采集、
到达、对话、护送
到达、对话、护送
表现:完成动效、
奖励弹窗
奖励弹窗
服务器
逻辑
逻辑
组队同步:
进度共享、离队处理
进度共享、离队处理
数据持久化:
掉线恢复、跨天重置
掉线恢复、跨天重置
功能测试
冒烟/回归/兼容
客户端性能测试
服务端压测/协议
人工测试
(结构、框架是新增,没办法AI测试:
· 新增任务类型框架验证
· 任务系统与新玩法的
首次集成联调
· UI交互细节走查
(布局、动效、适配)
· 剧情演出质量主观评审
· 需求不明确/用例不规范
的探索性测试
另外,可能需求不明确,
用例不规范)
QA:集成测试
程序:可以单元测试
SDD闭环了
TestAgent (VLM+POCO)
Bug Agent (Log+context+KB)
50%
· 任务面板UI元素校验
· NPC对话交互(视觉识别+点击)
· 任务追踪导航到达验证
· 任务完成弹窗表现验证
TestAgent (SDD-function call)
Bug Agent (基于视觉) 50%
· 击杀N只怪→进度→提交
· 采集M个物品→进度→提交
· 到达区域→触发完成
· 日常接取→完成→次日重置
· 放弃→重接→进度重置
TestAgent (SDD-function call)
Bug Agent (Log+context+KB)
80%
· 前置条件不满足→接取失败
· 背包满→奖励→邮件兜底
· 掉线重连→进度恢复
· 跨天→日常/周常重置
· 组队共享→离队→状态验证
· 活动到期→任务清理
· 老版本存档数据迁移
性能问题定位
Profile tools自动化分析
Tracy
90%
TestAgent
(脚本驱动)
(脚本驱动)
· 大量任务列表
滚动帧率
· 上限任务数
内存占用
Bug Agent
(airperf
+context
+KB)
(airperf
+context
+KB)
90%
· 任务面板打开/关闭帧率
· 追踪HUD常驻性能开销
· 快速接取/放弃稳定性
· 无缝切场景任务同步耗时
· 追踪HUD常驻性能开销
· 快速接取/放弃稳定性
· 无缝切场景任务同步耗时
性能回归
TestAgent (SDD-protocol call)
Bug Agent for loadlab analysis
90%
· 批量模拟玩家同时接取
任务的协议压测
· 高并发任务提交响应验证
· 日常重置时刻大量任务
状态刷新压测
· 组队进度同步并发测试
· 跨服数据同步延迟测试
· 任务相关DB读写性能回归
人工测试
TestAgent (bot orchestration)
Bug Agent (Log+context+KB)
30%
Bug Agent (Log+context+KB)
30%
· 任务系统与背包/装备/战斗/社交等系统的交叉影响验证
· 历史版本已有任务的大范围回归验证
· 服务器BOT长时间运行稳定性验证
70%
· 历史版本已有任务的大范围回归验证
· 服务器BOT长时间运行稳定性验证
70%
↑
验证原有功能正常
🎯 G66 任务模块 · Agent 测试核心维度总结
| 🔬 测试核心 | 状态机驱动:接任务 → 完成条件 → 提交 → 领奖 → 触发下一个 对应GM指令链: mission 任务ID 1 → missionstep 任务ID 阶段 2 → missions 验证状态 |
|---|---|
| 📋 典型用例 | 自动化 任务链自动接取与流转验证 自动化 进度更新与同步检查 自动化 奖励发放正确性 自动化 断线恢复数据完整性 |
| 🛠️ Agent 策略 | Step 1 GM跳前置:mission 任务ID 2 强制完成前置 Step 2 接/提交任务:missionstep 任务ID 阶段 状态 Step 3 查进度奖励:missions / !#p.bag_comp.bag_items |
| ✅ 可覆盖 | 100% 任务逻辑流转(状态机全路径) 100% 条件判断(前置/等级/道具) 100% 奖励发放(道具/经验/货币) 100% 进度保存与恢复(掉线/跨天/跨周) |
| ❌ 不可覆盖 | 人工 剧情对话演出表现 人工 过场动画播放效果 人工 "去XX地点"等地图寻路操作 人工 NPC头顶标记视觉效果 |
| ⚡ 折中方案 | 折中 地图条件 → gotospace 场景ID + goto x y z 强制到位 折中 击杀/采集条件 → fmissionstep 任务ID 阶段 2 跳过 折中 剧情表现 → 留人工走查,Agent仅验证剧情触发的数据变更 |
Agent 路线说明:
Test Agent:以驱动游戏根据用例自主执行步骤为目标
- VLM+POCO:利用多模态大模型如Gemini 3.1识别界面,通过POCO驱动操作的方式。优势是灵活适应性强,缺点是效率较低、烧token
任务模块适用:任务面板UI操作、NPC对话点击、导航跟随验证
任务模块适用:任务面板UI操作、NPC对话点击、导航跟随验证
- SDD-function call:主要是借助SDD开发模式,封装一些可测试的有一定语义的组件,通过LLM的理解进行编排,形成执行序列或者是python脚本,驱动游戏执行。优势是执行效率高,缺点是需要程序配合封装接口,通用性弱一些
任务模块适用:任务全流程自动化(接取→击杀→采集→提交→验证奖励),是冒烟/回归的主力路线
G66 GM指令支撑:
mission/missionstep/fmissionstep
missions/manuals/gotospace/item
任务模块适用:任务全流程自动化(接取→击杀→采集→提交→验证奖励),是冒烟/回归的主力路线
G66 GM指令支撑:
mission/missionstep/fmissionstep
missions/manuals/gotospace/item
Bug Agent:
- 资源BUG检测:通过基于视觉的模型如seed进行时装皮肤的检测,通用性较强,但还是需要调优提示词
任务模块适用:任务面板UI异常、NPC标记显示异常、文字截断/重叠
任务模块适用:任务面板UI异常、NPC标记显示异常、文字截断/重叠
- LOG+context+KB:就是通过执行时的各种日志,加上提示词上下文,以及产品知识库来做BUG分析,定位问题。这个agent实现简单,但强依赖项目组经验和skills加载
任务模块适用:任务流程报错日志分析、进度异常定位、奖励发放异常追踪
任务模块适用:任务流程报错日志分析、进度异常定位、奖励发放异常追踪
📌 G66 任务模块核心结论:
· 功能测试:0% Agent(新增框架)
· 冒烟/回归/兼容:80% Agent
· 客户端性能:~100% Agent
· 服务端压测:~100% Agent
任务流程 = 状态机,步骤明确、判定条件客观,是Agent自动化的理想场景
Agent核心策略:
GM跳前置 → 接/提交任务 → 查进度奖励
不可覆盖部分(剧情/地图)用GM折中
· 功能测试:0% Agent(新增框架)
· 冒烟/回归/兼容:80% Agent
· 客户端性能:~100% Agent
· 服务端压测:~100% Agent
任务流程 = 状态机,步骤明确、判定条件客观,是Agent自动化的理想场景
Agent核心策略:
GM跳前置 → 接/提交任务 → 查进度奖励
不可覆盖部分(剧情/地图)用GM折中