cnki-aigc-rewrite

When to use

用户做以下任一动作时触发：

提到"知网AIGC检测""AI率""红色显著""降AIGC""降AI率"
上传AIGC检测报告（PDF/截图）
贴出一段被标为红色或疑似的论文文本
询问"怎么改这段不像AI写的"

仅适用于中文学术论文（学位论文、期刊投稿、学术报告）。不适用于：

摘要/Abstract（结构化文本天然像AI，但通常不计入AI字符数）
文献引用密集段（"X等（2020）发现……"难以脱模板）
研究方法固定描述句（"采用双向固定效应模型"是规范表达）
非学术文本（自媒体、营销文案、小说）

核心认知：检测器抓的是什么

知网AIGC检测器不是抓"AI写的"，而是抓5种语言模式。理解这5种模式比记规则更重要：

模式1：句法节奏的可预测性 — LLM输出句长集中在20-35字（正态分布），人类写作是齐夫分布（少数特别长、少数特别短、多数中等）。改写要刻意打破均匀。

模式2：信息密度的均匀性 — LLM每段密度都差不多，人类写作有"高密度论证段"和"低密度铺陈段"。检测器跟踪段级特征值方差。

模式3：术语的句法位置固定 — LLM倾向把术语放在主语位置（"逆向技术溢出转化为创新能力"），人类更常放在话题或宾语位置（"企业把外部技术转化为创新能力"）。不动术语本身，但挪动它在句子里的角色。

模式4：连接词功能重叠 — LLM爱用"因此""从而""进而""由此"，功能高度重叠都在做因果推进。人类的连接词承担多种功能：补充（也就是说）、转述（换句话说）、强调（——）、对照（同向）。

模式5：模板段功能全等性 — 三/四项工整排比、抽象名词链、段尾元话语收束、模板化报告句、平行铺陈+末尾收束。这5个具体特征是上面5种模式的表层呈现。

工作流：根据输入长度自动切换

路线A：交互式精修（输入<800字）

用户贴一段红色显著文本进来，按以下步骤处理：

步骤1：识别高危特征 扫描这段文本，列出它命中了下面哪几个具体特征（不必全列，列最关键2-3条）：

三/四项工整排比（"从X看……从Y看……从Z看……" / "对A……对B……对C……" / "一方面……另一方面……" / "A以a为主；B以b为主；C以c为主"）
抽象名词链（"传导机制""调控变量""动态监测体系""未被纳入检验的路径仍是传导重要环节"）
段尾元话语（"这一结论""上述发现表明""为后续……提供了实证依据"）
模板化报告句（"X的研究表明""在统计推断意义上获得支持""与预期方向一致""下降至/上升至"）
平行铺陈+末尾收束

步骤2：执行改写动作 按下列动作改写。保留所有数字、变量名、文献编号[N]、年份、作者姓名、专业术语：

拆三/四项排比：每一项换不同句式起头（描述句/判断句/动宾句/转折句各一）
- ❌ "从产业基础来看……从人力资本来看……从投资动机来看……"
- ✅ "中部处于工业化中期；高校与高职供给的工程技术劳动力够用；OFDI动机上又以战略资产寻求型为主"
抽象名词链 → 动词短语：
- "传导机制较为契合" → "跟……同向"
- "在统计推断意义上获得支持" → "被样本较为充分地支持"
- "动态监测体系" → "看看是不是还走在一起"
删段尾元话语：让段落自然结束。
替换LLM典型语套：
- "研究表明" → "看到的是"/"读出的是"
- "进一步揭示" → "再往下看是"
- "下降至" → "跳到"
- "一致" → "对得上"/"同向"
- "释放/呈现" → 用具体动作替换
打乱句长方差：长短句穿插，用"——""换句话说""问题是""也就是说"让节奏不均匀。不要写成短句串+连接词，那是另一种AI腔。
挪动术语句法角色：原文术语在主语位置的，改写时换到宾语或话题位置。

步骤3：自检5项

输出前必须过一遍：

数字、变量名、引用[N]是不是一字未动？
段落里还有没有任何"X的Y的Z"三层名词嵌套？
有没有两组以上"A，B，C"并列结构？
段尾有没有"这一……""上述……"元话语收束？
全段是否倒向口语化（找不到任何学术连接词）？保留至少2-3个学术连接词（"鉴于""因此""二者"），否则会从AI腔倒向博客腔。

任一项不通过，重写。

Done when： 输出包含改写版 + 改了哪些高危特征（1-3条最关键的）+ 未动的部分（数字/术语/引用列表）。

路线B：批量处理（输入>800字或整节）

用户贴整节文字进来，按以下步骤：

步骤1：标定高危段落 通读全节，按红色密度排序输出一个清单：

段[起始词]…：高危特征 [排比/抽象名词链/元话语/模板报告/铺陈收束]

让用户确认要改哪几段（可能用户只想改密度最高的1-2段）。

Done when： 给出排序清单等用户选择。

步骤2：批量改写选定段落 按路线A的步骤2/3对每一段改写。每段输出格式：

【段N原文】
（节选首15字...）

【改写版】
（完整改写后段落）

【改了哪些】
- （1-2条最关键改动）

Done when： 所有选定段落改写完，每段都通过自检5项。

硬约束（不可违反）

数字、变量名（ln_X / β / R²）、统计量、p值、t值、系数、年份、文献编号[N]、作者姓名、模型名一字不动
专业术语不替换（"互补效应""逆向技术溢出""中介效应""固定效应""稳健性检验"——这些是学科共识词）
不增减事实陈述——原段说什么，改写后必须仍说同样的事
段落长度与原文相差不超过±15%

不要做的事

不要换同义词（"显著"→"明显"）。检测器抓句法，词汇替换无效。
不要全面口语化。论文是学术文体，要保留至少2-3个学术连接词，否则评阅老师观感差。
不要把所有"较为""一定程度上""显著"删光——这些"有保留余地的学术语"反而是人写的特征。
不要给术语加引号造距离感（"所谓……"，"二分法"）——这是LLM典型动作。
不要把长句拆成短句串+大量连接词——这只是另一种AI腔。

实测降幅参考

按这套方法实战处理一篇本科毕业论文：

指标	首检	复检	变化
总AI率	20.6%	10.1%	-10.5个点
第1部分	4.2%	0.0%	全部归零
第2部分	26.0%	15.8%	-10.2个点
第3部分	22.6%	13.7%	-8.9个点

最关键变化：全文红色显著片段全部降为疑似——这是质变而不只是量变。10%左右是中文学术语体本身的下限，再降会损失学术性。

边界提醒

如果用户改完一轮还想继续降到5%以下：劝退。低于10%通常意味着语体已经不像学术论文。
如果用户的论文本来就不是LLM生成、是自己写的却被误判：仍按本流程处理，特征是相同的。
如果用户给的不是中文论文：拒绝并说明skill仅适用于中文学术论文。