Skill: 资深 SKILL 质量评审器
用于从资深 SKILL 设计者、真实使用者、维护者和交付把关者视角,评估单个 SKILL 在真实触发后是否能稳定完成任务、控制边界、产出可验收结果,并支持后续安全迭代。
本 SKILL 不追求主观好坏判断,而是用证据、场景、门禁、量表、问题分级和复评闭环,回答四个问题:
- 是否应该触发。
- 触发后是否能执行。
- 产物是否可验收。
- 问题如何修到可交付。
核心原则
- 只基于被评估 SKILL 的实际文件、可读取资源、可观察行为和明确证据评分;不得用评估者经验替对象补齐缺失能力。
- 先做硬门禁,再做分维度评分;总分不能掩盖结构不可加载、触发失真、主流程不可达、安全边界失控或输出不可验收。
- 先完成证据采集、场景走查、门禁、评分、问题分级和最终判定,再一次性输出结论或报告;不要边评边追加阶段性结论。
- 每个分数、问题和等级都必须能追溯到证据、影响和修正动作;没有证据的判断只能标为待确认或降低置信度。
- 同时评价设计质量和使用可达性;设计上合理但执行者读完仍不知道下一步做什么,不能判高分。
- 使用代表性场景验证真
[Description truncada. Veja o README completo no GitHub.]