妙创 · 设计论述 / 2026 · wesliang

妙创

画面编排,是AI创作的线索 :)

AI时代创作流:迸发灵感,落笔文本,定格画面,转动态视频。然而,我们仍然在小输入框里跟提示词较劲。我开始思考一种对视频创作者更友好的交互探索。这是一次对创作流程的迭代尝试。

查看正文

Background · 背景

传统创作流程里“校验”

随着大模型能力快速提升,AI 已经能够自动生成剧本、角色、分镜和视频。然而,受限于模型成本/LLM沟通GAP,我们不得不花时间在每个步骤古法手作,参与校对和矫正(尤其生视频前)。

用户必须先把脑海中的想法转译成文字,再用文字驱动 AI 生成内容。我创作时,也总是苦与理解文本,想象抽象的画面。

传统影视创作流程
  1. 灵感
  2. 写剧本
  3. 画分镜
  4. 制作视频

The Overlooked Conflict · 被忽视的矛盾

我们对文字天然陌生,依赖个体的想象力

  • 画面
  • 镜头
  • 氛围
  • 情绪
  • 节奏

先阅读左边的文字,你对脑海里有对应的画面了吗?

01廊下全景。竹椅、旧茶壶。远处雾中有窑烟。老林佝偻的身影坐在椅上。
02老林的手。停了。手指微微发颤。
03纸的边角。一行清秀的字:你答应过我,要烧出最轻的那一只。 落款——阿秀。

Problem · 问题定义

AI与人的沟通过程充满信息损失。

信息损耗路径
  1. 脑内画面
  2. 转换成文字
  3. AI 理解文字
  4. 重新生成画面

于我而言,如果没有画面做锚点,故事想象就会像无根的浮萍,难以落地。

Cognitive Translation Cost

认知翻译成本

想法在「画面 → 文字 → 画面」的反复转译中被不断稀释。

Thesis · 主张

如果AI剧创能像读 漫画书 一样呢?

自动生成连贯画面,图并茂地串联故事,直接进入画面编辑。

重新定义
  1. 灵感
  2. 分镜宫格
  3. 节奏编排
  4. 视频生成
传统流程
  1. 灵感
  2. 剧本
  3. 故事板
  4. 视频

Design Principles · 设计原则

设计原则

01

画面感

Visual First

优先用低成本传达画面+文字。用户可以直接从想象中的场景开始创作

02

直接操作

Direct Manipulation

以分镜为操作锚点,减少 Prompt 依赖

03

连贯性

Coherence

考虑构建故事结构的起承转合

Solution · Demo1

AI直出线稿组,营造 画面感

>输入想法,输出图文并茂的故事板
故事板界面:剧本解析为分镜宫格图,同步生成视频预览

用户获得一个可视化的故事结构,如导演桌上的分镜卡片。

Interaction · Demo2

原子分镜,直接操作故事节奏

  • 拖动镜头卡片即可重排叙事顺序,无需改写 Prompt
  • 节奏变化自动联动时长、密度与转场
节奏编辑界面:拖拽分镜直接调整故事结构

所见即所得,改的是故事节奏本身

Coherence · Demo3

组合输入 串联故事

  • 宫格图一次性输入,AI 工作流保持镜头间叙事连贯
  • 在完整故事流里编辑,减少跳切与断层
连贯性编辑:四张分镜合并为一张输入,保持叙事衔接

连贯镜头聚散有度,既保持叙事衔接,又给足控制感

Validation · 价值

加速前序画面Prompt调试时间

基于自己做短片创意测试的实测感受——真正减掉的是脑内画面 ↔ 文字 ↔ 画面之间的反复翻译。

Before

  • Prompt 多轮试错,才能把画面说清楚
  • 剧本改完,还要重新想象分镜
  • 分镜和最终视频经常对不上
  • 生视频前不得不逐格人工校对

体感耗时

一个想法折腾一下午

大量时间花在来回对齐

After

  • 先出分镜宫格,画面就是讨论语言
  • 拖拽改节奏,不必重写 Prompt
  • 连贯性校验前置,减少返工
  • 结构满意后,再进视频生成

体感耗时

粗稿验证约 1 小时

视频生成仍是重工序

Reflection · 小小的思考

AI 在激发创意上永远超乎意料。

很多人都在思考下一步的创作方式是什么样子。

以上只是我对脑海中画面表达的理解:如何更自然地定位想象起点。

也许新的交互范式可能更接近导演的创作方式。

因为人们
从来不是用文字做梦的。

Behind the Scene · Vibe Coding

幕后花絮·VibeCoding打磨动效片段