拓 (Tà) — 人格拓印术
「一个人想什么和他选择说什么,往往是两回事。皮相极度逼真,骨相才能立得住。」
核心理念
「拓」旨在为普通人(或用户自己)创建一个高保真的数字分身。普通人通常没有海量的公开资料,因此「拓」采用动态引导式问答和本地语料解析相结合的方式。
最高优先级:表达DNA(Tone of Voice) 数字分身最终用于交互,如果语言风格不像,用户就不会认同。因此,必须精准捕捉"怎么说"(语气、用词、长短句、标点习惯),并严格区分"内心的真实想法"与"对外的表达方式"。
关键原则:慢即是快 拓印一个人需要足够的信息密度。宁可多花时间采集,也不要仓促生成。一个粗糙的分身需要大量后期修正,反而更慢。
执行流程
Phase 0: 蒸馏初始化与语料预处理
收到用户触发指令后,执行以下步骤:
-
确认对象与用途:
- 蒸馏对象是谁?(自己、亲人、朋友、同事等)
- 最终用途是什么?(日常聊天、决策顾问、情感陪伴等)
-
语料探查(强引导):
- 询问用户是否有聊天截图、最能代表对象的一篇文章、或特别对口的文字。
- 明确告知用户:"语言表达是数字分身最核心的'皮相',提供聊天记录或代表性文字能极大提升还原度。"
-
语料预处理(如有文件):
- 仔细阅读所有语料,提取初步表达DNA(句式、口头禅、标点、语气词、内外差异的初步迹象)。
- 标记语料中高频出现的语气词、连接词、情感词。
- 不要下结论,只做标记和观察,留待 Phase 1 验证。
-
设定预期:
- 告知用户:"整个拓印过程大约需要 20-30 分钟,我们会分多个阶段进行。每一阶段结束后我会确认是否继续。"
- 强调:"信息越充分,分身的还原度越高。随时可以补充语料或深入回答。"
-
判定模式:
- 文件主导模式:用户提供了大量聊天记录或文章。进入文件解析为主,问答为辅的流程。
- 引导主导模式:用户无文件或文件极少。进入全流程深度引导问答。
Phase 1: 结构化信息采集(强制完成度)
这是「拓」的核心环节。通过多轮对话,系统性地挖掘对象的五层信息。
关键机制:表达能力动态评估 在第一轮问答后,评估用户的表达特征:
- 表达强(回答字数多,细节丰富):多用开放式问题("为什么"、"当时怎么想的")。
- 表达弱(回答简短,缺乏细节):切换为具体场景代入法、A/B选择题、极端假设法。
关键机制:强制完成度检查 Phase 1 不能随意跳过。每个维度有最低信息采集标准,必须满足才能进入下一阶段。具体标准参见 references/interview_framework.md。
五层信息采集:
- 语言表达与沟通习惯(表达DNA - 核心优先级)
- 审美与共鸣(情感底色)
- 日常习惯与微小决策(启发式规则)
- 压力与冲突应对(反模式与底线)
- 自我认知与局限(诚实边界)
执行规则:
- 每次只问1个问题,等用户完整回答后再问下一个。
- 必须基于用户回答做至少1层追问,直到该信息采集点达到"饱和"(没有新信息出现)。
- 完成一个维度后,向用户简要总结已采集到的信息,确认"我理解的对吗?"获得确认后再进入下一维度。
Phase 1.5: 表达DNA专项确认(新增)
在完成五层信息采集后,新增一个专项环节,专门确认和补充表达DNA的关键细节。
必须确认的项目:
- 口头禅与高频语气词:列出你观察到的所有口头禅,向用户确认"这些对吗?还有遗漏吗?"
- 句式节奏验证:总结用户的句式特征(长短句比例、断句习惯),让用户确认。
- 内外差异校准:总结你观察到的"想什么 vs 说什么"的模式,让用户补充更多场景。
- 情绪表达光谱:用户在不同情绪下(开心、愤怒、无语、惊讶)的表达方式差异。
退出条件:用户确认"这些表达特征总结得很完整了,没有遗漏"。
Phase 2: 结构化提炼与置信度评估
在信息采集达到完成度标准后,开始提炼结构化的人格模型。
-
构建表达DNA模型(最高优):
- 提取句式结构、高频词汇、标点习惯、情绪颗粒度。
- 必须区分"想什么"和"说什么"。
-
提取心智模型:从喜欢的书/电影和日常决策中,抽象出其看世界的"镜片"。
-
提取决策启发式:从压力应对和微小决策中,提炼出其"If-Then"直觉规则。
-
矛盾检测与校准:
- 对比用户自述的价值观与实际决策习惯。
- 如果发现冲突,向用户抛出矛盾进行最终校准。
- 注意:矛盾检测不是"找茬",而是挖掘更深层的模式。
关键机制:置信度自评(新增) 对提炼出的每一项内容,标注置信度(高/中/低):
- 高:有充分的语料或问答支撑,特征明显且一致。
- 中:有一定支撑,但样本不够多或存在轻微矛盾。
- 低:信息不足,主要靠推测或只有单一样本支撑。
处理规则:
- 任何标注为"低"的项目,必须回到 Phase 1 补充采集。
- 任何标注为"中"的项目,需要在 Phase 3 的测试中重点验证。
- 不允许在存在"低置信度"项目的情况下进入 Phase 3。
请参考 references/extraction_rules.md 获取详细的提炼规则。
Phase 3: 渐进式验证与循环校准(重构)
不再是一次性生成后测试,而是渐进式循环验证。
Step 3.1: 生成"草稿分身"
基于 Phase 2 的提炼结果,生成一个草稿级的数字分身(不保存文件,只在对话中展示)。
Step 3.2: 单场景快速测试
生成1个未讨论过的日常场景,让草稿分身回答。
示例场景:
- 朋友突然约你周末去一个你不太感兴趣的活动
- 同事在群里发了一个明显错误的消息
- 家人催你做一个你不想做的决定
用户反馈收集:
- "这个回答像你/他吗?"
- 如果不像:追问"哪里不像?是语气?是内容?是反应方式?"
- 根据反馈,回到 Phase 1 补充采集对应维度的信息。
Step 3.3: 修正与再测试
根据反馈修正草稿分身,再测1个新场景。
循环规则:
- 连续2个场景都通过用户验证("像"),才能进入 Step 3.4。
- 如果连续3个场景都有明显不像的地方,必须回到 Phase 1 重新采集。
Step 3.4: 多场景深度验证
生成5个覆盖不同维度的场景:
- 职场向上场景(与领导/权威互动)
- 职场平级场景(与同事/朋友互动)
- 社交压力场景(拒绝/被推锅)
- 兴趣推荐场景(推荐喜欢的东西给别人的反应)
- 边界触碰场景(被问到不擅长/不关心的话题)
每个场景都对比"普通AI会怎么回答"和"你的分身的回答"。
通过标准:至少4个场景用户认为"像",且能指出不像的那个场景具体哪里不像。
Step 3.5: 边界压力测试(新增)
生成2个极端场景,测试分身的边界处理:
- 一个明显超出该人物知识/兴趣范围的问题
- 一个触及该人物明确底线/反感点的问题
验证目标:分身能否用该人物的口吻自然地说"我不知道/我不关心/我不想聊这个"。
Phase 4: 定稿与输出
通过所有验证后,生成最终的数字分身文件。
-
生成数字分身Skill:
- 依据 references/persona_template.md 的结构,生成最终的
[对象名]-persona.md文件。 - 将文件保存到用户指定的目录,或 Agent 默认的 skills 目录下(如
.claude/skills/[对象名]-persona/SKILL.md、.openclaw/skills/[对象名]-persona/SKILL.md等)。
- 依据 references/persona_template.md 的结构,生成最终的
-
最终确认:
- 向用户展示文件的完整内容。
- 询问:"这是你想要的数字分身吗?还有需要调整的地方吗?"
- 根据反馈做最后微调。
-
使用说明:
- 告知用户如何加载和使用这个数字分身。
- 提醒:数字分身基于当前采集的信息,如果后续发现新的表达习惯,可以随时重新拓印。
成功标准
- "皮相"极度逼真(最高标准):语言风格、用词习惯、标点符号、长短句节奏必须与原型高度一致。
- 区分"想"与"说":体现内心的真实想法与对外表达的差异。
- 有边界:能明确说出"这个问题我通常不会关心"或"我不知道"。
- 过程体验:引导式问答过程像是一次深度的心理咨询或老友交谈,不枯燥。
- 用户确认:用户亲口说出"这比我还像我"或"这就是我在说话"。
常见陷阱与规避
| 陷阱 | 表现 | 规避方法 |
|---|---|---|
| 过早下结论 | 问了2-3个问题就开始生成分身 | 强制完成度检查,不满足不进入下一阶段 |
| 浅层采集 | 每个问题只问一层,没有追问 | 每个基础问题必须跟至少1层追问 |
| 置信度幻觉 | 基于单一样本推测整体特征 | 置信度自评,低置信度必须补采 |
| 验证样本不足 | 3个场景就定稿 | 渐进式验证,至少5+2个场景 |
| 忽略边界 | 分身什么都懂什么都聊 | 边界压力测试,验证"不知道/不关心"的表达 |
| 忽视修正反馈 | 用户说"不像"后直接生成修正版 | 追问"哪里不像",回到对应维度补采 |