SSkilltecabyclaudinhocode
Enviar skill
← Voltar para o catálogo

mathmodel-skill

Desenvolvimento

Um fluxo de trabalho completo para competições de modelagem matemática (CUMCM, MCM/ICM, 电工杯), abrangendo seleção de tópicos, modelagem, resolução, redação de artigos e revisão final. Ele inclui 10 estágios, 4 camadas de feedback, formato de perguntas e respostas numeradas e suporta empacotamento de plugins/Codex Skills/AGENTS.md, com interoperabilidade de estado entre Codex e Claude Code.

83estrelas
Ver no GitHub ↗Autor: handsomeZR-netizen

mathmodel-skill — 数学建模 三竞赛通用 Skill (v6.0)

10 阶段把"3-4 天打 1 篇竞赛论文"工程化, 全程问答式——用户只需回答编号问题, 不必手敲 bash / python / json。每阶段产出经过 rubric 自评 + section-level patch 精修, 跨阶段一致性回检, 终局多视角 panel。三竞赛通用框架 + 国赛 91 篇真烘焙 + MCM/电工杯 seed v0.1。

v6 更新: Codex-native packaging (agents/openai.yaml + .codex-plugin/plugin.json), 按 OpenAI Codex Skills / AGENTS.md / Plugins 的官方形态组织入口, 同时保留 v5 的 harness-agnostic 与 Friendly Mode。


Codex V6 原生入口

Codex 优先按 skill 目录发现本文件:

  • 用户级安装: $HOME/.agents/skills/mathmodel-skill/
  • 项目级安装: <repo>/.agents/skills/mathmodel-skill/
  • UI 元数据: agents/openai.yaml
  • 插件分发元数据: .codex-plugin/plugin.json + skills/mathmodel-skill/SKILL.md shim
  • 项目指导: AGENTS.md 仍可作为 repo / workspace 级 instructions, 但不是唯一入口

当 skill 已安装后, 用户可直接说"开始建模"或显式说"使用 $mathmodel-skill 开始建模"。


Harness 兼容 (Claude Code / Codex)

本 skill v6.0 以 Codex Skills 为一等入口, 同时保持 harness-agnostic 设计:

harness入口文件用户交互工具状态文件
Claude CodeSKILL.md (本文件)AskUserQuestion 工具cwd/state/decision_log.json
Codex CLI / Codex appskill 目录中的 SKILL.md + 可选 AGENTS.mdmarkdown 编号列表同上 (互通)

跨 harness 互通: day 1 用 Codex 跑 stage 0-2, day 2 切回 Claude Code 接着 stage 3+, 状态完全保留。详见 references/harness_compat.md


问答式优先 (Friendly Mode)

核心原则: 用户只需回答编号问题, 不应被要求手敲 bash / python / json。

  • 离散选项 (选竞赛 / 选题 / 选模型 / verdict 决策) → 必须用问答式
  • 自由文本 (PDF 路径 / 截止时间) → 单行回复
  • 状态读写 (decision_log.json) → agent 自动完成
  • 每个 stage 的关键决策点都有 "让我决定 (推荐 X)" 兜底选项, 用户无脑选 4 也能跑通

Claude Code: 用 AskUserQuestion 工具; Codex: 用 markdown 编号列表 (1-4 + 兜底)。两者语义等价, 见 references/harness_compat.md §1。


路径解析协议 (任何阶段必读)

类型位置
skill 内通用skill 根目录的相对路径references/stage_05.md, templates/shared/decision_log.json
竞赛特化competitions/<comp>/... 按 decision_log.competition dispatchcompetitions/cumcm/winning_patterns.md, competitions/mcm/abstract_template.md
LaTeX 模板templates/latex/<comp>/templates/latex/cumcm/cumcmthesis/, templates/latex/mcm/main.tex
用户产物用户 cwd/ 相对路径cwd/state/, cwd/results/, cwd/figures/, cwd/paper_workspace/
state 持久化cwd/state/decision_log.json各 stage 必读必写
环境变量MATHMODEL_STATE_DIR (兼容 CUMCM_STATE_DIR) / MATHMODEL_COMPETITION 可覆盖scripts 用此变量

约定: <skill>/ = skill 安装目录, <cwd>/ = 用户 cwd, <comp>/ = 当前竞赛 (cumcm | mcm | diangong)。


Quick Start (用户首次说"开始建模")

1. 一段话介绍 (≤50 字): "启动数学建模工作流, 10 阶段 + 三竞赛, 全程问答式."

2. 一次性 5 问 (Claude Code: AskUserQuestion 单条消息; Codex: 5 个编号列表):
   - 竞赛 (cumcm 国赛 / mcm 美赛 / diangong 电工杯, 默认 cumcm)
   - 题号 (依竞赛: cumcm A-E / mcm A-F / diangong A-B; "未公布"亦可)
   - 队员数 + 各人擅长 (建模/编程/写作)
   - 截止时间 (ISO 字符串或 "距现在 X 小时")
   - 题目 PDF 路径 ("未公布"亦可)

3. 自动初始化 (agent 自动完成, 不要让用户编辑 json):
   - 不存在 cwd/state/decision_log.json → cp <skill>/templates/shared/decision_log.json
   - 写入 decision_log.competition = <选定竞赛>
   - 已存在 → 读 current_stage 字段决定恢复点

4. 加载 competitions/<comp>/winning_patterns.md 一次 (建立基线), 后续不再读

5. 进入 Stage 0 (references/stage_00_kickoff.md), 不重复问已问过的问题

已有 state 触发 (用户中途回到 skill):

1. 读 cwd/state/decision_log.json 的 competition 与 current_stage
2. 加载对应 stage_NN.md (按需结合 competitions/<comp>/* 内容)
3. 不重复读 winning_patterns

三竞赛 × 三模式 矩阵

时长 / 语言 / 模板 / 数据状态 由 competition 决定; token 预算 / 反馈深度由 mode 决定。两者正交组合

Competition时长语言LaTeX子问数 IQR数据状态
cumcm72h中文xelatex / cumcmthesis[3, 5]stable (91 篇 2023-2025)
mcm96hEnglishpdflatex / article[3, 6]seed v0.1
diangong72h中文xelatex / ctex[6, 8]seed v0.1
ModeToken反馈层用途
fast≤ 50kL1 单次选题试跑 / sanity check
standard≤ 200kL1+L2默认主流程
championship≤ 500kL1+L2+L3+L4 + red-team提交前最后冲刺

模式自动推荐 (按距 deadline 剩余):

  • 60h: standard (最后 6h 升 championship)

  • 24-60h: standard
  • 6-24h: fast 关键阶段 + championship 终审
  • < 6h: 直接进 stage 9 (championship)

10 阶段索引

#阶段reference时长反馈竞赛差异点
0团队启动 + 资料预扫stage_00_kickoff.md1hL1时长 / 语言 / 编译器 / 题号体系
1选题 (多题对比 → 1)stage_01_problem_selection.md2-4hL1题号体系 (A-E/A-F/A-B) + task_type 写入
2问题深度解析与分解stage_02_analysis.md2-3hL1通用
3模型选型 (≥3 候选)stage_03_model_selection.md2-4hL1 + 反事实通用
4Foundation (假设+符号+术语)stage_04_foundation.md1hL1通用
5递归子问题循环 Q1..Qn + per-Qi 加权聚合stage_05_subproblem_loop.md6-12h × nL1 + 子检查点子问数差异 (cumcm 4 / mcm 4 / diangong 7); per-Qi 加权
6全局灵敏度 / 稳健性stage_06_robustness.md2-3hL1 + L2工程参数 (diangong) vs 数学参数 (cumcm/mcm)
7模型评价 + 推广stage_07_evaluation.md1-2hL1通用
8论文写作stage_08_writing.md12-30hL1摘要类型 (5段 / 1-page+Letter / 4段) + LaTeX 模板
9终稿审核 + Panelstage_09_review.md2-6hL1 + L3 panelanti_patterns + panel personas 各异

加载协议 (节省 token 的关键)

只在进入阶段 N 时加载 references/stage_NN_*.md切勿一次性全读。

各阶段额外加载 (按需 + 按 competition 切换):

  • 每阶段开头: cwd/state/decision_log.json 必读
  • 每阶段结尾: cwd/state/decision_log.json 必写 (核心决策 + 5 维评分)
  • stage 1-9: references/rubrics.md 对应章节 (L1 评分用)
  • stage 1: competitions/<comp>/topic_specs.json (题号 → task_type 映射)
  • stage 3, 5: references/model_catalog.md (跨竞赛通用)
  • stage 5: per-Qi 评分跑完后调 scripts/score_artifact.py --mode aggregate_qi 聚合
  • stage 8: competitions/<comp>/{winning_patterns, phrase_bank, abstract_template, paper_skeleton}.md
  • stage 8 硬阈值评分: competitions/<comp>/empirical.json 注入 evidence (cumcm 真值; mcm/diangong seed 自动带 [seed: ...] 标记)
  • stage 9: competitions/<comp>/anti_patterns.md (逐条对照) + rubric_overlay.json 的 panel_personas
  • 触发反馈时: 对应 references/feedback_layer*.md
  • harness 适配差异 (Codex 用户必读): references/harness_compat.md

收敛准则 (统一定义, 三处一致)

verdict 优先级 (从高到低):

verdict触发行为
blockissues 含 ≥1 high-severity暂停 skill, 用户介入
pass_earlyraw_min ≥ 9 AND weighted_mean ≥ 9iter-1 早退
passraw_min ≥ 7 AND weighted_mean ≥ 8进下一阶段
pass_with_review (stage 5)任 Qi mark_for_review 但加权阈值满足进 stage 6, L2 必读 review_qis
refine其他section-patch 精修, iter+=1 (cap 3)
refine_partial (stage 5)任 Qi.min < 7, 其他 Qi 已 pass仅 refine 该 Qi, 不动其他
carryoveriter == 3 仍 refine进下一阶段, 标记由 L2 处理

weighted_mean = Σ(s_i × w_i) / Σ(w_i), 权重来自 config/dim_weights.json[<comp>][<task_type>] (clamp [0.7, 1.5]); task_type=default 全 1.0 等价老逻辑。

此定义在 feedback_layer1_critic.md / rubrics.md / scripts/score_artifact.py 三处必须完全一致


状态持久化

每阶段:

  • 开头: Read cwd/state/decision_log.json, 核对 current_stage 与上下文
  • 结尾: 更新 stage 节点 (核心决策 + 摒弃方案 + 评分), current_stage += 1

decision_log.json v3.0 schema 关键字段 (与 templates/shared/decision_log.json 对齐):

  • root: competition, task_type, mode, current_stage, budget, events
  • stage_5 扩展: qi_count, qi_weights, qi_status
  • scores 扩展: 含 weighted_mean, review_qis, refine_qis (stage 5 加权聚合用)

L2 跨阶段回检 (stage 5/6/8 末尾) 读这个文件主动找冲突, 触发定向回滚: 不重做整阶段, 只针对冲突点。


Token 预算纪律

  • L1 Critic 强制 JSON 输出, ~500 token/次
  • 精修策略: section-level patch (scripts/extract_diff.py), 不重传完整 artifact (省 ~60% token)
  • references/ 与 competitions/ 文件懒加载, 本 SKILL.md 主体 ≤ 6k tokens
  • 阶段完成后, artifact 摘要 + 关键数据 + 路径写入 decision_log, 不在上下文保留全文
  • 超预算 30% → 自动降级 (championship → standard, standard → fast)

用户指令快捷

  • "进入 stage N" / "重做 stage N" → 跳转
  • "切到 mcm" / "切到 cumcm" / "切到 diangong" → 改 decision_log.competition (注意已有 state 兼容性)
  • "升级到 championship" → 启用 L3 + L4 + red-team
  • "切到 fast" → 关闭迭代
  • "回退到 stage M" → 读 decision_log, 回退 current_stage 并清理 ≥M 节点
  • "做 L2 回检" → 立即触发 cross-stage backtrack
  • "看进度" → 输出 decision_log 摘要 + 当前评分

数据来源声明

  • competitions/cumcm/: 91

Como adicionar

/plugin marketplace add handsomeZR-netizen/mathmodel-skill

O comando exato pode variar conforme o repositório. Confira o README no GitHub.

Comentários · Nenhum comentário

Entre para comentar. Entrar

  • Ainda não há comentários. Seja o primeiro.