AI 短剧精细化 IP 创作 v0.6.0
v0.6.0 changelog(2026-05-16)
SD-002《城市恋综》EP01 36 grid × 3 轮(v2.5/v2.6/v2.7)跑 + 全审反推。从「16/36 灾难级一致性破损」修到「0 灾难 / 60% ≥4 分」+ 沉淀 2 个工业级 SOP。
关键升级
-
⭐
references/storyboard-frame-industrial.mdv0.3.0:分镜图工艺 SOP- 8 段 prompt 模板(CHARACTER/BACKGROUND/ACTION/SCENE/CAMERA/LIGHT/TEXT/STYLE)
- NOT humans 子句必加:每个主角单独
Xxx body IS [arch] architecture NOT a human wearing X NOT a human with headpiece - ref 库工艺偏置铁律:现代摩天楼易拟物 / 古建筑必出 chibi 人体
- 多角色 SOP:1 主角 ref + N 文字 silhouette + bokeh blur
- 戏剧光词库(25+ 关键词)+ 红果级首帧 10 条 checklist
- 11 节完整文档(含 EP01 v2.7 实测验证 grid13/21/22 全 5/5)
-
⭐
references/jimeng-failure-modes.mdv0.1.0(新):即梦 5.0 失败模式 + 敏感词全清单- 3 类 fail 完全区分:InvalidNode(字数超) / generation failed(审核) / 无 image_url(网络)
- prompt 字数硬上限:1500 字符(实测分布表)
- 反派词替换表:sinister/menacingly/dark intent → moody/leaning/quiet
- 暧昧词清单:blush/cheeks/extreme close-up → rose tint/medium shot
- 并发 vs 串行限流:长 prompt + 并发 = fail,长 prompt 必单跑
- 4 个 grid 实战诊断 case + 工艺校验 checklist
-
⭐ scripts/生成分镜图.py 加
--no-fingerprintflag- 防 02_IP简报.md 的 ref 风格视觉指纹(neutral / flat / NOT cinematic)污染分镜图 dramatic 光
- max_workers 8 → 4(降并发防限流)
- timeout 300 → 420s + 重试 2 次(防长 prompt 超时)
最大教训
ref 工艺是分镜图工艺的上游。
ref 不纯(chibi 人体),分镜图加 NOT humans 也救不回来。
前期 IP 设计阶段就要避坑:选玻璃塔 / 简单几何,避复杂古建筑。
v0.3.0 changelog(2026-05-08)
SD-001 实战 + 工业级方法论调研沉淀。新增 Phase 1.5 分镜图层 + 4 模视频生成。
关键升级
- ⭐ Phase 1.5 分镜图层(工业级 5 步流程核心)
scripts/生成分镜图.py:每 grid 1-4 张候选关键帧(text2image)- 分镜图 = 视频首帧(image2video / frames2video 输入)
- 修改成本 3 积分/张 vs 视频 55 积分/段 = 18 倍便宜
- 视频构图 = 静态图(不再随机)
- ⭐ 4 模视频生成(auto 按文件存在自动选)
image2video:分镜图首帧 + 动作 prompt(默认主用 80%)frames2video:首帧 + 尾帧锁定(关键爆点 10%)multiframe2video:2-20 关键帧一镜到底(复杂动作 5%)multimodal2video:9 image + 3 video + 3 audio fallback(5%)
- ⭐ ref 5-8 最优(不塞 9 → 注意力分散)
- ⭐ @ 指令显式职责语法(@图片1 作为角色参考 / @视频1 参考运镜)
- ⭐ 关键 grid 首尾帧(爆点/反派/心声/卡点必锁)
文档新增
references/storyboard-frames-craft.md(分镜图工艺 + 4 模选择)
脚本新增 / 改
scripts/生成分镜图.py(新,Step 3)scripts/生成分集视频.py(改,支持 4 模 auto 选)assets/templates/分镜.json(新增 video_mode / first_frame_path / last_frame_path / multiframe_paths 字段)
v0.2.0 changelog(2026-05-08)
SD-001「重生穿越为哮天犬」实战沉淀。13 个失败模式 → 13 个修复 + 工业级标准。
关键修复
- ⭐ scripts/生成分集视频.py(替代 bash):subprocess args list 直接调 dreamina,避 bash eval 在中文/特殊字符 prompt 下 quoting 出错(旧 bug 导致 multimodal2video 任务被 server 静默丢弃,list_task 假活 30+ 分钟)
- ⭐ scripts/ref完备性检查.py:生视频前强制扫所有 (@xxx_ref.png) 引用,本地缺失就 exit 1
- ⭐ scripts/派生分集文件.py:从分镜.json 一键派生即梦批量包.md / 镜头清单.md
- regex 修复:含全角中文
)stop 字符(r'@([^\s),)]+_ref\.png)') - multimodal2video stuck 自动检测:提交后 check
queue_status == 'Generating',否则 fallback 到 list_task 找回 submit_id
节奏升级
- 36 grid × 4-10s 变奏 替代 60 grid × 3s 死板(multimodal2video 最低 4s,3s 不合法)
- 红果必爆 7 招(详
references/v21-97-percent-rules.md) - 时长分布:4s × 11 + 5s × 14 + 6s × 5 + 7s × 3 + 8-10s × 3 = 36 段 / ~190s
素材标准升级
- ref 库目标 80-150 张(vs v0.1.x 22 张)
- 单 prompt 300-500 字(vs v0.1.x 100-200 字)
- ref 分层:① master 风格 ② 角色基础多角度 ③ 角色表情库 ④ 关键动作 ⑤ 场景多角度 ⑥ 道具细节
文档
- 新增
references/troubleshooting.md(13 失败模式 + 解法) - 新增
references/v21-97-percent-rules.md(7 招 + 24 集校准模板) - 改
references/storyboard-craft.md为 36 grid 4-10s 变奏 - 改
references/jimeng-cli-guide.md加 v0.2.0 升级 + 网页端可见性
核心架构:2 Phase
┌─ Phase 1:创作(成本低,反复迭代)─────────────────┐
│ 阶段 0:市场情报扫描 │
│ 阶段 1:IP 简报(5 子步) │
│ 阶段 2:故事架构(4 子步) │
│ 阶段 3:设定圣经(4 子步) │
│ 阶段 3.5:ref 图自动生成(dreamina CLI) │
│ 阶段 5:批判 refine │
└──────────────────────────────────────────────────┘
↓
┌─ Phase 1.5:分镜图(v0.3.0 工业级核心)⭐ 新增 ─────┐
│ ⚠️ 写 prompt 前必读: │
│ - storyboard-frame-industrial.md §5(8 段模板) │
│ - jimeng-failure-modes.md §1+§2(字数+敏感词) │
│ 对每一集独立运行: │
│ 3A:写该集分镜.json(v0.3.0 字段:video_mode + │
│ first_frame_path + last_frame_path) │
│ 3B:python scripts/ref完备性检查.py │
│ 3C:python scripts/生成分镜图.py(每 grid 1-4 │
│ 张候选关键帧 = 视频首帧) │
│ 3D:人工选图(grid01_候选3.png → grid01.png) │
│ 3E:关键 grid(爆点/反派/心声)生首尾帧 │
│ (gridXX_首.png + gridXX_尾.png) │
└──────────────────────────────────────────────────┘
↓
┌─ Phase 2:出片(成本高,按集解锁)────────────────┐
│ 4.A:python scripts/生成分集视频.py │
│ auto 模式按文件存在自动选 4 模: │
│ - frames2video(首尾帧锁定) │
│ - image2video(分镜图首帧 + 动作) │
│ - multiframe2video(2-20 帧一镜到底) │
│ - multimodal2video(fallback 多 ref) │
│ 4.B:用户在剪映拼接 + 配音 + BGM + 字幕 │
└──────────────────────────────────────────────────┘
为什么这么拆:
- 剧本 / ref 不满意 → Phase 1 反复改,不烧视频钱
- 分镜图 = 视频首帧 → Phase 1.5 静态图先确认(3 积分/张),不满意改 prompt 重生 → 视频构图固定(不再随机)
- 修改成本:分镜图 3 积分 vs 视频段 55 积分 = 18 倍便宜,省视频试错 50%+
- 视频出片成本高 → Phase 2 按集解锁,每集都让用户验收
- AI 短剧的真正成本不是创作,是出片。用 Phase 1 + 1.5 把构图打磨到位,Phase 2 才值得花钱
触发条件
下列任意一个都触发:
- 用户说"做/写/帮我做 ... 短剧"
- 提到红果/番茄/抖音/快手 IP 改编
- 提到即梦/Seedance/可灵/Vidu 出片,并谈到剧本
- 提到分镜、storyboard、shot list、镜头脚本
- 提到爽剧、虐剧、追妻、复仇、重生、穿越、赘婿、奶奶觉醒、神医相师、AI 漫剧奇观
不触发的反例:
- 用户已有完整剧本,只想改某句台词 → 直接改
- 用户问"短剧行业前景如何" → 普通问答
- 用户问"什么是 AI 短剧" → 普通问答
默认参数(v0.6.0)
| 项 | 默认值 | 来源 |
|---|---|---|
| 单集时长 | 180-195s | 红果实测最优(不严卡 180) |
| 集数 | 24 集(精华)/ 72 集(常规) | 24 集省成本 + 紧凑爆点 |
| 单集分镜数 | 36 grid × 4-10s 变奏 | multimodal2video 最低 4s,变奏防机械感 |
| 时长变奏分布 | 4s×11 + 5s×14 + 6s×5 + 7s×3 + 8-10s×3 | v2.1 红果必爆铁律 |
| 视频比例 | 9:16 竖屏 | 红果/抖音/快手统一 |
| 视频模式 | multimodal2video(全能参考) | Seedance 2.0 Fast VIP,多 ref 输入最稳 |
| 字幕 | 开(中文括号包 + AIGC 标识) | 红果强制 |
| ref 库目标 | 80-150 张(工业级) | 含动作/表情/场景多角度/道具细节 |
| 单 prompt 字数 | 300-500 字 | 含动作物理 + 表情拆帧 + 灯光 + 字幕规格 |
| 平台 | 红果(默认)+ 抖音(次选) | 月活 3 亿 + 引流 |
| 流派 | 互动选 | 红果纯爽 / 精品悬疑 / 漫剧奇观 / 沙雕轻喜 / 年代爽剧 |
| 付费模式 | 互动选 | 免费(广告)/ 付费(解锁) |
| ref 图生成 | dreamina text2image 4-grid(多角度) | Phase 1 阶段 3.5 |
| 视频出片 | dreamina multimodal2video(含视觉指纹自动 append) | Phase 2 阶段 4.C |
| 跑视频前预检 | 必跑 python scripts/ref完备性检查.py | 防 ref 漏 → AI 自由生成 → 一致性破 |
每次启动都要问用户是否调整这些。
关于 AI 优势(用户提示,不强推但要点出):
AI 生视频真正的护城河 = 真人难拍的奇观(修仙 / 末世 / 西游 / 玄幻 / 异能)。如果用户题材是奶奶觉醒 / 都市追妻这种真人易拍的,告诉用户:"虽然 AI 也能做,但 AI 真正优势在漫剧奇观流。要不要考虑切换流派?"——给 1 次提示,用户决定。
Phase 1:创作(5 阶段 + 阶段 3.5)
阶段 0:市场情报扫描(4 子步)
0.1 联网搜当下 Top 5 剧名
搜索 1:红果短剧 排行榜 <YYYY-MM>
搜索 2:番茄小说 改编 IP <近 30 天>
搜索 3:抖音短剧 <用户题材关键词> 热度
搜索 4:DataEye 短剧观察 / QuestMobile 月报
搜索 5:短剧 平台 审核 <当前年> 红线
0.2 真读 1-2 部爆款的业界拆解(核心)
WebFetch 1-2 部爆款的剧情解说 / 业界拆解文章。优先源:woshipm / 36 氪 / 腾讯新闻 / 21 经济网。
如果全部 403 → fallback 到内置 references/red-fruit-data.md。
0.3 给用户 3 选项菜单(不要直接出报告)
让用户挑差异化角度。
0.4 写入 01_市场情报.md
详见 references/market-pulse.md。
阶段 1:IP 定位(5 子步)
1.1 流派选择(关键)
5 选项让用户挑:A 红果纯爽流 / B 精品悬疑流 / C 漫剧奇观流 / D 沙雕轻喜流 / E 年代爽剧流。
v0.1.2 新增提示:在选项 C 旁加注:「真人难拍 = AI 优势。如果你计划用 AI 出片,C 是最有性价比的选择,因为修仙/末世/玄幻类真人剧组成本极高,AI 直接生」。但不强推,让用户判断。
详见 references/genre-flavors.md。
1.2 题材原型(1 主 + 1 副)
详见 references/archetype-catalog.md。
1.3 核心钩子(草拟 3 版让用户挑)
1.4 重复爽点公式(草拟 2 版让用户挑)
1.5 写入 02_IP简报.md
详见 references/ip-strategy.md。
阶段 2:故事架构(4 子步)
2.1 三幕结构骨架
2.2 关键反转节点(让用户挑)
2.3 72 集大纲(先给关键 25 集让用户确认)
2.4 写 03_完整剧本.md + 04_节奏地图.json
详见 references/story-architecture.md。
阶段 3:设定圣经(4 子步)
3.1 角色清单(≤ 6 人)
3.2 5 特写镜头人格锚定
3.3 视觉母题 + 反差点 + 服装表 + 即梦 ref prompt
3.4 写 3 份圣经
05_角色圣经.md + 06_场景圣经.md + 07_道具圣经.md
详见 references/character-design.md。
阶段 3.5:ref 图自动生成(v0.1.2 新增,关键)
这是 Phase 1 的最后一步,也是 Phase 2 的前置依赖。
3.5.1 检测 dreamina CLI
which dreamina && dreamina --version
如果未装 → 引导安装:
curl -fsSL ht