小说改文生图提示词总出错？用这个『DeepSeek』指令定制方案，人物不再“变脸”

更新时间：2026-03-05 11:02:17一点通 - fjmyhfvclm

最近有一位做短剧内容的客户找到我，她在把古装短剧剧本转化成文生图提示词时遇到了一个很典型的问题：同一个角色，前一张图是黑发高髻，下一张变成了披肩散发；刚刚还穿着月白长裙👗，转场就换了颜色。十几张图出来，人物的脸、服装、气质全都对不上，根本没法用于连贯的分镜制作。

她用的是通用写法，直接把剧情描述粘贴进去，让工具自己理解画面，结果每一张图都像是不同演员在演同一个角色。

这个问题的本质不是工具不行，是提示词的逻辑没有打通。

文生图和写文案不一样。文案可以靠上下文推断语气，图像没有上下文记忆——你每输入一条提示词，工具看到的都是一张白纸。所以如果你不在每一条提示词里把人物的外貌信息写清楚，工具只能靠随机猜测来填充细节，人物“变脸”就成了必然。

要解决这个问题，需要在指令层面做一件事：在生成任何画面之前，先强制建立一份固定的人物视觉档案，然后要求每次人物出镜时都必须完整复述档案信息。这不是技巧，是底层逻辑。

我交付给她的指令，核心设计了两层结构：

第一层：人物视觉档案前置锁定。

在指令的第一步，不是让工具直接出图，而是先通读全文，把所有主要人物的固定视觉标签提取出来，格式必须包含年龄、发型头饰、服装颜色材质款式、面部特征，统一建档。

这一步的目的是给整个创作过程设定一个“人物数据库”。只要这个数据库在，后续每一张图的人物描述都有据可查，不会出现信息漏填或自由发挥的情况。

以客户的古装短剧为例，我帮她把女主沈瑶定义为：18岁，清冷坚韧，鹅蛋脸，东亚面孔，黑『长发』高髻淡玉簪，淡雅长裙👗。这条描述一旦锁定，无论后续出现多少个场景，这个人物的视觉呈现就有了固定的坐标。

第二层：强制嵌入机制——人物每次出镜都必须复述完整描述。

这是整套指令里最关键的一条规则，也是大多数人写提示词时最容易忽略的地方。

很多人觉得，第一条提示词里写过人物描述了，后面就不用重复了。这个逻辑在写文章时没问题，在文生图里完全失效。每一条提示词是独立的，工具不会记住你之前说过什么。

我的处理方式是在指令里写死一条死命令：只要画面中出现主要人物，必须在人物称呼后的紧邻位置，用括号完整插入第一步定义好的视觉描述，包括性别、年龄、服饰和『妆容』。哪怕上下两句只隔了逗号，也要重复。

这条规则执行起来看上去有点繁琐，但它直接解决了人物“变脸”的根本原因。

除此之外，我还在指令里对空镜头做了专项处理：如果画面中没有人物，开头必须标记“无人，空镜头”，再接具体描述。这个区分让工具在处理纯景物镜头时不会莫名其妙地往里塞人物，整体分镜的节奏感会更稳。

用了新指令之后，前后对比很明显。旧方式出来的提示词是这样的：林萧站在厅堂中央，看着对面的乔玉，白天，古风背景。

工具收到这条描述，对林萧的年龄、发型、服装一无所知，全靠随机生成，每次出图都是不同的人。

新指令生成的提示词是这样的：林萧（女，18岁，清冷坚韧，鹅蛋脸，东亚面孔，黑『长发』高髻淡玉簪，淡雅长裙👗，表情冷静）站在将军府正厅中央，直视对面的年轻女性♀️，白天，背景是雕花立柱和青砖地面，正面中景，光线从侧面窗棂透入，柔和自然光。

同一个人物，前后出图的发型、服装、气质稳定了很多，客户拿去做分镜连贯性明显提升。

客户反馈说，以前出十张图大概能用三四张，现在用新指令基本能用七八张，废图率降了不少，返工时间缩短了很多。

小说或剧本转文生图这个需求，现在越来越普遍，但大多数人卡在“提示词写完人物就变形”这一关，绕不过去。

核心问题只有一个：有没有在指令层面给人物建立固定的视觉档案，并强制每次出镜都复述。这个底层逻辑想清楚了，人物一致性的问题基本可以解决大半。

如果你也在做短剧、漫画或小说的分镜转化，遇到了类似的卡点，不妨重新审视一下你的指令有没有做这两层设计。