海外访问:www.kdjingpai.com
Ctrl + D 收藏本站
当前位置:首页 » AI实用指令

AI视频创作的“黑客秘籍”:用JSON结构化提示词精准控制画面

2025-07-07 53

当前,AI 视频生成技术正迅速发展。以 Google Veo 3、海螺 AI 和可灵等模型为代表的工具,其生成能力已超越早期那种模糊不清的阶段,能够产出接近电影质感的视频片段。

然而,普通用户在实际应用中依然面临两个核心难题:首先,非专业用户往往只有一个模糊的想法或几个零散的关键词,很难独立撰写出符合影视制作规范的专业提示词;其次,自然语言的模糊性与 AI 的“理解”之间存在偏差,导致生成结果常常偏离预期,需要反复修改调试。

Image

最近,社交平台 X 上的一位博主分享了一种新颖的解决方案:使用 JSON 格式为 Google Veo 3 编写提示词。这种方法为解决上述痛点提供了一个全新的思路。

以下是该博主分享的 JSON 提示词,包含英文原版和中文翻译版:

英文版提示词:

{
"shot":{
"composition":"Medium shot, vertical format, handheld camera",
"camera_motion":"slight natural shake",
"frame_rate":"30fps",
"film_grain":"none"
},
"subject":{
"description":"A towering, snow-white Yeti with shaggy fur and expressive blue eyes",
"wardrobe":"slightly oversized white T-shirt with the name 'Emily' in bold, blood-red letters across the chest"
},
"scene":{
"location":"lush forest clearing",
"time_of_day":"daytime",
"environment":"sunlight filtering through the canopy, creating dappled light patterns on the forest floor"
},
"visual_details":{
"action":"Yeti holds a smartphone on a selfie stick, speaking excitedly to the camera before letting out a dramatic scream",
"props":"smartphone mounted on a selfie stick"
},
"cinematography":{
"lighting":"natural sunlight with soft shadows",
"tone":"lighthearted and humorous"
},
"audio":{
"ambient":"rustling leaves, distant bird calls",
"dialogue":{
"character":"Yeti",
"line":"Veo3 Fast is now available in the Gemini app—three videos per day! People are going to prompt me like crazy!",
"subtitles":false
},
"effects":"sudden loud scream, flapping wings of startled birds"
},
"color_palette":"naturalistic with earthy greens and browns; bold red lettering on shirt provides contrast"
}

中文版提示词:

{
"镜头":{
"构图":"中景,竖屏格式,手持相机",
"相机运动":"轻微自然摇晃",
"帧率":"30fps",
"胶片颗粒":"无"
},
"主体":{
"描述":"一只高大的雪白雪人,毛发蓬松,眼睛充满表现力,呈蓝色",
"服装":"略微过大的白色T恤,胸前用粗体血红色字母写着‘Emily’"
},
"场景":{
"位置":"郁郁葱葱的森林空地",
"时间":"白天",
"环境":"阳光透过树冠洒下,形成斑驳的光影模式在森林地面"
},
"视觉细节":{
"动作":"雪人拿着自拍杆上的智能手机,兴奋地对着镜头讲话,随后发出一声戏剧性的尖叫",
"道具":"安装在自拍杆上的智能手机"
},
"摄影":{
"照明":"自然阳光,柔和的阴影",
"基调":"轻松幽默"
},
"音频":{
"环境音":"沙沙的树叶声,远处的鸟鸣声",
"对白":{
"角色":"雪人",
"台词":"Veo3 Fast现在可以在Gemini应用中使用——每天三条视频!人们会疯狂地给我发提示!",
"字幕":false
},
"音效":"突然的大声尖叫,惊飞的鸟翼拍打声"
},
"色彩调色板":"自然主义风格,带有泥土般的绿色和棕色;T恤上的鲜艳红色字母提供了对比"
}

使用上述英文提示词,Google Veo 3 生成了一段高质量的 ASMR 风格短视频。

为什么 JSON 格式是更优的指令?

JSON(JavaScript Object Notation)是一种轻量级的数据交换格式,它通过键值对来组织数据,例如 "镜头": { ... }。它支持数据嵌套,结构清晰,易于人类阅读,也便于机器解析。

当 JSON 用于 AI 提示词时,其优势非常明显。它将一个模糊的创意分解为一系列具体的、结构化的参数,涵盖了镜头、主体、场景、灯光、音效等多个维度。这种方法不仅内容全面,指令也非常清晰。

大型语言模型(LLM)天然就偏好这种结构化数据。因为 LLM 的训练数据中包含了海量的代码和结构化文本,使其能够高效且准确地解析 JSON,从而最大限度地减少因自然语言模糊性而产生的歧义。此前在 ChatGPT 4o 进行文生图的探索中,JSON 提示词同样被证明可以显著提升图像生成的可控性。

如何让 AI 帮你写 JSON 提示词

尽管 JSON 格式很强大,但为每个创意都手动编写如此详尽的 JSON 文件,工作量巨大且效率低下,这并不符合使用 AI 提升效率的初衷。

那么,能否让 AI 来完成这项工作?答案是肯定的。我们可以构建一个“系统提示词”,让大模型根据用户输入的简单关键词,自动生成符合规范的 JSON 结构化提示词。

通过对前述 JSON 示例进行分析,可以逆向工程出一个通用的系统提示词模板。

Image

以下是构建完成的系统提示词,你可以直接在 ChatGPTGemini 或其他大模型中使用。

# 你是一个专业的AI视频提示词生成专家。
## 任务:
当用户输入一个简短提示(如“赛博朋克街头的一位女子”),你需要:
1. 理解并补全用户未提及的关键信息(包括镜头、主体、场景、动作、摄影、音频、色彩氛围等)。
2. 基于用户提示的意图推测并丰富内容,确保输出能直接用于AI文生视频工具。
3. 输出结果必须是符合如下JSON架构的提示词。
{
"shot": {
"composition": "镜头构图/画幅比例/拍摄方式",
"camera_motion": "相机运动",
"frame_rate": "帧率",
"film_grain": "胶片颗粒感"
},
"subject": {
"description": "主体形象描述",
"wardrobe": "服装与外观"
},
"scene": {
"location": "地点",
"time_of_day": "时间",
"environment": "环境细节"
},
"visual_details": {
"action": "主体动作",
"props": "道具"
},
"cinematography": {
"lighting": "光线风格",
"tone": "整体情绪与基调"
},
"audio": {
"ambient": "环境音",
"dialogue": {
"character": "说话角色",
"line": "台词内容",
"subtitles": "是否显示字幕(true/false)"
},
"effects": "音效"
},
"color_palette": "整体色彩风格"
}
## 工作要求:
- 即使用户输入很简单,你也要合理发挥想象,生成丰富的细节。
- 避免输出JSON以外的任何解释或文字。
- 保证JSON语法正确,字段与示例完全一致(不要新增或减少字段)。
- 对“dialogue”部分,如果用户没有指定,可留空白台词或让主体简单说一句符合场景的台词。
- 对“audio”中的“subtitles”,默认输出 false,除非用户明确要求加字幕。
## 使用方法:
只需将用户的简短提示输入给我。
## 输出:
输出英文版、中文版两个版本。

实践指南:创建你自己的提示词生成器

你可以将上述系统提示词封装成一个 GPTs(适用于 ChatGPT)或 Gems(适用于 Gemini),方便随时调用。

以 ChatGPT 为例,在创建 GPTs 时,建议在配置中勾选 Canvas 功能,并在指令中加入“输出到 Canvas”的要求。Canvas 功能允许用户直接在画布上对生成的 JSON 代码进行修改,非常便于微调。

Image
Image

配置完成后,使用起来就非常简单。例如,输入一个简单的想法:“一个小男孩正在打篮球。”

GPTs 会立刻生成结构完整、细节丰富的中英双语 JSON 提示词。用户可以根据目标 AI 视频平台支持的语言选择其一。如果需要修改任何细节,直接在 Canvas 画布中编辑即可。

Image

完成修改后,将最终的 JSON 代码复制到 Veo 3 等 AI 视频工具中,即可生成高度符合预期的视频。这种方法极大地提升了提示词的完整性和出片准确率。

如果你想直接体验,可以访问已创建好的 GPTs:https://chatgpt.com/g/g-68677841368081919478ba33ad7c4056-aishi-pin-ti-shi-ci-sheng-cheng-zhuan-jia-json

案例展示:从关键词到电影预告片

为了检验该方法的效果,这里提供一个生成电影感片段的实际案例。

用户输入: “一辆法拉利在夜晚的城市街道上飞驰”

AI生成的JSON提示词:

{
"shot":{
"composition":"First shot: wide shot of Ferrari speeding down the street; second shot: driver’s frontal close-up; third shot: close-up of car window details, 2.35:1 cinematic ratio",
"camera_motion":"First: stable pan, second: slight push-in, third: static shot",
"frame_rate":"24fps, total duration 8 seconds",
"film_grain":"Slight film grain"
},
"subject":{
"description":"A shiny red Ferrari sports car; the driver is a stern-faced man wearing sunglasses",
"wardrobe":"Driver in a black suit with black sunglasses"
},
"scene":{
"location":"Modern city street",
"time_of_day":"Night",
"environment":"Neon signs, tall buildings reflecting headlights, wet pavement"
},
"visual_details":{
"action":"Ferrari speeds by, driver stares ahead, neon lights reflecting on the car window",
"props":"Ferrari sports car"
},
"cinematography":{
"lighting":"Strong contrasts between neon lights and streetlights",
"tone":"Tense, mysterious, urban night mood"
},
"audio":{
"ambient":"Engine roar, tire screeches, distant city noise",
"dialogue":{
"character":"Driver",
"line":"Tonight, there can only be one winner.",
"subtitles":false
},
"effects":"Powerful engine rev sound effect"
},
"color_palette":"Dominant deep blues and vibrant reds highlighting the cold night and Ferrari’s passion"
}

Image

通过这种方式,可以快速生成多个风格统一、剧情连贯的视频片段。将这些片段组合起来,甚至可以剪辑出一部颇具看点的“伪”预告片《幻速·NeoRun》。

这个案例中,创作者使用了以下工具:

  • 提示词生成ChatGPT 搭载 JSON 生成系统
  • 音视频生成Google Veo 3
  • 封面制作: 即梦 2.1

这种结构化的工作流,让用户的角色从一个苦苦思索如何描述画面的“提示词工匠”,转变为一个只需提出核心创意、审核 AI 生成方案的“创意总监”。它并没有替代人类的创造力,而是将“想得到”与“做得到”之间的鸿沟,缩短为一次简单的关键词输入和几次点击。

这或许预示着一个全民皆可创作的时代正在到来,而下一个打动人心的故事,可能就藏在任何人脑海中的那几个关键词里。

相关推荐

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

邮箱

联系我们

回顶部

zh_CN简体中文