Midjourney做漫剧全流程教程：从人物设定到分镜生成

2026-04-07 · 作者: 速创AI · 分类: 教程

想学Midjourney做漫剧？本文从人物设定、风格统一、分镜设计到批量生成与后期剪辑，手把手讲清完整流程，帮助你快速搭建高效AI漫剧工作流，立即收藏实践。

在AI内容生产快速普及的当下，Midjourney做漫剧已经成为越来越多创作者关注的方向。相比传统漫剧制作需要角色设计、场景绘制、分镜草图、上色、后期合成等多环节协作，借助Midjourney、提示词工程与简单的视频剪辑工具，个人创作者或小团队也能在较短时间内完成一部具有视觉统一性和叙事张力的漫剧作品。

但很多人真正上手时会遇到几个核心问题：人物形象不稳定、不同场景画风跳变、镜头之间缺乏连续性、分镜无法服务剧情、成片节奏混乱。要解决这些问题，不能只把Midjourney当成“出图工具”，而要把它纳入一套完整的漫剧生产流程。从人物设定、风格锚定、场景搭建，到镜头规划、分镜生成、后期整合，每一步都需要有方法论。

这篇文章将围绕Midjourney做漫剧的完整路径，系统讲解从0到1的实操流程。无论你是想做短篇剧情漫剧、竖屏故事号内容，还是用于品牌叙事、IP孵化、小说推文配套素材，都可以参考本文的方法搭建自己的AI漫剧工作流。

一、为什么用Midjourney做漫剧：优势、限制与适用场景

1.1 Midjourney做漫剧的核心优势

Midjourney做漫剧之所以受到欢迎，核心原因在于它同时提升了“出图效率”和“视觉上限”。传统漫剧往往需要画师持续输出角色立绘、场景图和分镜画面，而Midjourney可以在几分钟内生成多个高质量候选方案，大幅压缩前期美术成本。

具体来看，它有以下几个优势：

高效率出图：一个角色设定往往可以在10-30分钟内产出多个版本。
画面质感强：在二次元、电影感、写实漫画、赛博朋克等风格上表现尤其突出。
灵感扩展快：通过变化提示词，可以快速探索服装、发型、灯光、构图方案。
适合批量内容生产：对于短视频平台连载型漫剧，一个成熟工作流可以持续产出。

以一个60秒竖屏漫剧为例，如果按照8-12个主要镜头来规划，传统方式可能需要角色原画、背景图、分镜草图和后期排版，总工时可能在2-5天；而如果采用Midjourney做漫剧，在已有角色与风格模板的前提下，图像生成与素材准备时间可压缩到半天到1天，效率提升非常明显。

1.2 Midjourney做漫剧的常见限制

当然，Midjourney并不是“输入一句话就能自动出片”的万能工具。很多新手失败，恰恰是忽略了它的限制。

角色一致性不足：同一个人物在不同镜头中可能出现五官、发型、服饰变化。
动作控制不够精确：复杂肢体、多人互动、连续动作镜头容易出错。
文字能力有限：画面中直接生成对白框、招牌文字常常不稳定。
分镜逻辑需要人工设计：AI可以出图，但不自动等于会讲故事。

因此，真正高质量的Midjourney做漫剧流程，不是“想到什么就生成什么”，而是先建立角色库、风格库、镜头表，再有计划地进行画面生产。把AI当成高效美术助手，而不是替代创作判断的黑盒工具，效果会更好。

1.3 适合哪些漫剧类型

并不是所有内容都适合用Midjourney完成。现阶段更适合以下几类项目：

剧情类短篇漫剧：如都市情感、悬疑反转、校园故事、古风虐恋。
小说推文配图漫剧：重点是高密度情绪场景与强视觉钩子。
IP概念片：用于展示角色设定、世界观、视觉气质。
品牌故事短视频：通过漫画式镜头强化叙事表达。

如果你的内容非常依赖精确动作演绎，比如高强度打斗、复杂转场、多人持续互动，那么仅靠Midjourney做漫剧会比较吃力，通常需要结合其他AI工具或后期修图技术共同完成。

二、前期策划：人物设定、世界观与风格统一

2.1 先写“角色圣经”，再开始出图

很多人做AI漫剧时，一上来就写提示词，这是效率最低的方式。更稳妥的方法是先建立角色文档，也可以理解为“角色圣经”。

一个完整的角色设定表，至少应包含以下内容：

基础信息：姓名、年龄、性别、身份、职业。
外貌锚点：发色、瞳色、脸型、身高、体型、标志性配饰。
服装系统：常服、战斗服、校园服、礼服等不同场景版本。
性格关键词：冷静、偏执、温柔、傲慢、敏感等。
视觉气质：阴郁、明亮、贵气、破碎感、少年感、御姐感。

例如，你要做一个都市悬疑漫剧，女主可以这样设定：

角色示例：28岁女记者，黑色中长发，冷白皮，琥珀色眼睛，常穿米色风衣和深色高领，随身携带录音笔，气质克制冷静但内心执拗，有轻微失眠感。

这类设定看似“文字化”，实际上是Midjourney做漫剧稳定出图的基础。因为AI更适合围绕高重复、可识别的视觉元素来维持一致性。

2.2 用提示词建立统一的角色模板

角色文档完成后，接下来要做的是生成“标准角色图”，也就是每个主要人物的定妆照。建议每个角色至少生成以下3类基础图：

正面半身图
全身立绘图
情绪变化图（冷静、愤怒、悲伤、惊讶）

以下是一段适合女主定妆的提示词思路：

提示词结构示例：
young female investigative journalist, black shoulder-length hair, amber eyes, pale skin, beige trench coat, dark turtleneck sweater, holding a recorder pen, calm but stubborn expression, cinematic manga style, detailed lineart, soft dramatic lighting, urban noir atmosphere, character design sheet, front view, full body --ar 2:3 --stylize 150

你也可以进一步加入风格限制，如：

manga panel style
anime cinematic lighting
consistent character design
clean line art

在Midjourney做漫剧时，建议先用少量关键词锁定角色核心特征，再逐步添加风格描述，不要一开始就堆砌太多修饰词。否则画面虽然华丽，但人物容易漂移。

2.3 建立风格板与场景板，避免画风跳变

角色稳定只是第一步。真正让漫剧像“一个作品”而不是“一堆AI图片”的关键，在于风格统一。建议你在正式生成分镜前，先做两块内容：

风格板：确认线条粗细、色彩饱和度、光影方式、镜头质感。
场景板：确定主要场景，如办公室、街道、地铁站、公寓、天台等。

比如都市悬疑风格常见视觉策略是：

低饱和冷色为主
夜景蓝灰调
局部暖光强调情绪
中近景和特写多于大全景

你可以先生成5-10张“气氛图”，作为后续所有分镜的参考底板。这样做的好处是，当你后续使用Midjourney做漫剧时，每个镜头都能围绕统一的视觉基调展开，而不是出现上一张偏日漫、下一张偏电影写实、再下一张又像游戏原画的问题。

三、从剧本到镜头：Midjourney做漫剧的分镜设计方法

3.1 先写短剧本，再拆成镜头表

很多创作者误以为分镜就是“把剧情一句句变成图片”，其实并不准确。漫剧是视听叙事，镜头承担的是节奏、情绪、信息密度和视觉转折。用Midjourney做漫剧之前，必须先有一个适合镜头化的短剧本。

一个60秒左右的短漫剧，比较常见的结构是：

前5秒抛钩子：制造悬念、冲突或情绪爆点。
中段建立信息：交代人物关系、事件背景。
后段反转或情绪升级：推动传播与完播。

举个简单例子：

剧情梗概：女记者调查一桩旧案，在深夜档案馆找到一张十年前的合照，发现照片中失踪者竟然和自己长得一模一样。

这个剧情可以拆成如下镜头：

镜头1：深夜档案馆长廊，压抑空镜，建立氛围。
镜头2：女主推开门，侧脸特写，神情紧张。
镜头3：手翻动旧文件的近景。
镜头4：发现旧照片，镜头突然推近。
镜头5：照片中少女脸部特写，与女主相似。
镜头6：女主瞳孔收缩，情绪爆发。

这一步的核心不是写得多复杂，而是让每个镜头都有功能。这正是Midjourney做漫剧能否呈现“戏感”的分水岭。

3.2 常用镜头类型与提示词写法

为了让AI画面更接近分镜需求，建议在提示词中明确镜头语言。以下是常见镜头类型：

establishing shot：建立场景的大全景
wide shot：展示人物与环境关系
medium shot：适合对话、动作展示
close-up：强调情绪
extreme close-up：突出细节，如眼神、手指、物件
over-the-shoulder shot：适合对视、发现线索
low angle / high angle：塑造压迫感或弱势感

例如，镜头4“发现照片”的提示词可以写成：

提示词示例：
close-up shot of a pale female journalist discovering an old photograph in a dusty archive room, tense fingers holding the photo, dim tungsten light, noir manga style, suspenseful mood, cinematic framing, detailed hands, paper texture --ar 16:9 --stylize 100

镜头5“照片中的少女特写”则可写成：

提示词示例：
extreme close-up of an old faded photograph showing a teenage girl with black hair and amber eyes, uncanny resemblance to the female journalist, vintage paper, eerie atmosphere, manga cinematic style, dramatic contrast --ar 16:9

在Midjourney做漫剧过程中，把“镜头语言+主体信息+情绪+光影+风格”组合起来，比单纯描述人物更容易得到可用分镜图。

3.3 一套实用的分镜表模板

为了提高生产效率，建议你建立标准分镜表。每一列可以包括：

镜头编号
剧情内容
景别
机位
人物动作
情绪关键词
提示词草案
是否已生成
是否需修图

示例：

1号镜头：档案馆外景；大全景；夜景；冷蓝色；建立悬疑氛围。
2号镜头：女主进门；中景；侧机位；谨慎观察；压抑。
3号镜头：手翻档案；近景；俯拍；节奏加快；紧张。
4号镜头：发现照片；特写；正面；情绪骤变；惊异。

用这种方式做Midjourney做漫剧，最大的好处是你可以批量化生成、筛选和替换镜头，而不至于在后期剪辑时才发现画面逻辑不通。

四、实操流程：用Midjourney批量生成漫剧画面并提高一致性

4.1 从单图测试到批量生产的标准步骤

真正高效的流程不是“一个镜头一个镜头临时想”，而是先测试、再定版、后批量。比较推荐的流程如下：

生成角色定妆图：锁定主要人物视觉锚点。
生成风格样张：确认整体画风、色彩和线条。
测试关键场景：例如夜晚街道、办公室、医院、校园。
先做3个核心镜头：验证人物在不同景别中的稳定性。
修正提示词模板：把有效词保留，无效词删除。
批量生成剩余镜头：按镜头表逐一执行。

这个流程看起来多了一步前测，但实际可以降低大量返工。尤其是在Midjourney做漫剧时，前期模板一旦跑通，后面10个、20个镜头都可以在同一逻辑上快速产出。

4.2 保持人物一致性的5个技巧

角色一致性，是AI漫剧成败的核心。以下5个技巧非常实用：

固定核心特征：每次都重复人物最关键的外貌元素，如“black shoulder-length hair, amber eyes, beige trench coat”。
固定服装组合：不要每个镜头都改变服装细节，否则很难统一。
固定风格描述：例如始终带上“cinematic manga style, clean line art, noir lighting”。
使用参考图思维：以定妆图为母版，后续镜头围绕同一人物描述生成。
先生成少量可复用姿态：比如站立、回头、奔跑、惊讶、低头等，建立角色素材库。

例如同一女主在不同镜头中，都可以保留以下固定串：

固定角色描述：female journalist, black shoulder-length hair, amber eyes, pale skin, beige trench coat, dark turtleneck

然后根据镜头变化补充：

walking through archive hallway
holding old photo
shocked expression
close-up face under dim light

这种“固定主干+变化动作”的写法，是Midjourney做漫剧里提升角色连续性的高频技巧。

4.3 提高画面可剪辑性的3个重点

AI出图好看，不代表适合剪成漫剧。真正实用的画面，需要考虑后期可剪辑性。

重点一：统一画幅比例
如果你做的是横屏视频，建议统一16:9；如果是短视频平台竖屏漫剧，可以优先测试9:16构图。画幅不统一，后期很容易裁掉关键主体。

重点二：保留运动空间
例如人物不要每次都居中顶满画面，适当留白，后期才能加推拉、平移、缩放等简单运动效果。

重点三：镜头之间有节奏变化
一部完整的漫剧，不应该全是特写。建议遵循“大全景建立空间—中景交代动作—近景强化情绪—特写制造爆点”的节奏逻辑。

很多人使用Midjourney做漫剧时，容易沉迷于“每张图都很美”，结果所有镜头都是氛围特写，最后剪出来视觉疲劳、信息不足。一定要让镜头功能服务剧情，而不是只服务单张图片审美。

五、后期合成与发布：让Midjourney漫剧真正变成可传播内容

5.1 漫剧成片需要哪些后期步骤

当你完成所有镜头画面后，接下来要做的是把静态素材变成“可观看的内容”。通常需要以下后期步骤：

筛选镜头：从每个镜头中选出最符合剧情的一张。
基础修图：统一肤色、对比度、光影方向，修掉明显错手、错脸、错物件。
剪辑排版：按剧本顺序排入时间线，控制节奏。
添加字幕和对白：字幕一定后期添加，不建议直接让AI生成。
加入转场和镜头运动：适度推拉、缩放、局部位移即可。
配音与音效：旁白、对白、环境音、BGM都能显著提升完成度。

一条60秒漫剧的镜头数量通常在8-15个之间。若镜头切换过慢，用户容易滑走；如果切换太快，信息又无法吸收。实操中，前3秒建议1-2秒一个镜头，中段可稍慢，高潮段再加快，这种节奏更适合短视频平台传播。

因此，Midjourney做漫剧的最终效果，其实是“AI画面质量+后期节奏控制”的综合结果，而不是单一依赖生成模型本身。

5.2 适合短视频平台的漫剧剪辑技巧

如果你的目标平台是抖音、快手、视频号、小红书，那么内容形式要更贴近移动端观看习惯。以下技巧非常关键：

开头3秒必须有冲突画面：例如哭泣、拥抱、发现秘密、危险来临。
字幕要大且清晰：建议单行不超过16字，重要台词断句呈现。
情绪节点要有音效：翻页声、心跳声、门响、回音都能增强沉浸感。
结尾留钩子：例如“她终于看清照片上的名字，却愣住了”。

一条适合传播的AI漫剧，往往具备两个特点：视觉强钩子和剧情反转。用Midjourney做漫剧最大的优势，就是你可以快速做出高冲击力的视觉封面和关键画面，从而提升点击率和完播率。

5.3 建立可复用的AI漫剧生产线

如果你不是只做一条内容，而是想长期运营，那么必须建立模板化生产线。建议你至少沉淀以下资产：

角色提示词库：主角、配角、反派、群像人物设定。
场景提示词库：教室、办公室、别墅、医院、街道、天台、地铁等。
镜头提示词库：大全景、中景、近景、特写、俯拍、仰拍等。
情绪词库：绝望、愤怒、欣喜、心碎、迟疑、惊惧。
后期模板：字幕样式、BGM风格、转场节奏、封面样式。

当这些资产积累起来后，Midjourney做漫剧就不再是一次性尝试，而会变成稳定的内容生产能力。比如同一个账号如果每周更新3条，每条12个镜头，一个月就需要约144张核心画面。有模板和库的情况下，生产速度和一致性都会显著提升。

六、常见问题与避坑清单：新手做AI漫剧最容易错在哪里

6.1 只追求画面精美，忽略故事节奏

这是最常见的问题。很多创作者用Midjourney做漫剧时，把精力都放在提示词修饰上，追求“绝美壁纸感”，结果每个镜头都很满、很静、很像海报，但无法推动叙事。漫剧不是画集，真正重要的是“故事在动”。

解决办法很简单：

先有剧本，再有提示词。
先做镜头表，再做画面优化。
每个镜头只承担一个核心任务。

6.2 镜头过多，导致制作效率下降

新手容易把一个30秒剧情拆成20多个镜头，导致每张图都要反复修，最后制作周期拉得很长。实际上，短视频漫剧更适合少而精的镜头组合。

一个经验值是：

30秒内容：5-8个镜头
60秒内容：8-12个镜头
90秒内容：12-18个镜头

在Midjourney做漫剧时，镜头数量越多，角色一致性和风格统一的难度也越高。因此不如优先保证关键节点足够强，而不是一味增加镜头密度。

6.3 完全依赖AI，不做人工筛选和修正

AI擅长生成，但不擅长替你判断“哪一张最适合剧情”。因此人工筛选和修图仍然必要。特别是以下情况，建议务必人工处理：

人物手部错误
五官轻微变形
服饰不统一
道具逻辑错误
镜头与台词信息不匹配

成熟的Midjourney做漫剧流程，通常不是100%自动化，而是“AI负责高效生成，人类负责审美判断和叙事决策”。这也是目前最现实、最有效的创作方式。

总结

Midjourney做漫剧并不是单纯地“让AI帮你画几张图”，而是一套从角色设定、风格统一、剧本拆解、分镜设计、批量生成到后期合成的完整创作流程。想要真正做出能看、能播、能持续更新的AI漫剧，关键不在于提示词堆得多复杂，而在于你是否建立了清晰的制作逻辑。

回顾全文，一条成熟的流程可以概括为：先写角色圣经与世界观，确定画风与场景基调；再把短剧本拆成有功能的镜头表；随后通过标准化提示词与角色模板批量生成画面，并用统一画幅、统一色调和固定视觉锚点提升一致性；最后结合字幕、配音、音效和节奏剪辑，完成真正适合平台传播的漫剧内容。

如果你希望把Midjourney做漫剧从尝试变成能力，最好的方法不是一次做出一部长篇，而是先从30-60秒的短篇开始，反复打磨一套可复制的工作流。等角色库、场景库、镜头库和后期模板都积累起来后，你会发现AI漫剧生产效率会大幅提升，内容风格也会越来越成熟。对于个人创作者、小团队，甚至小说推文账号和品牌内容部门来说，这正是未来值得重点投入的一条高性价比创作路径。