Omni 提示词
精选 Gemini Omni 视频生成/编辑提示词与案例库,含运镜、风格迁移、文字渲染
EvoLink 快速入门
将 Gemini Omni 提示模式转化为视频生成任务:
模型页面 · 文档 · API 密钥 · 视频模型 · Media MCP
export EVOLINK_API_KEY="your_key_here"
curl --request POST \
--url https://api.evolink.ai/v1/videos/generations \
--header "Authorization: Bearer ${EVOLINK_API_KEY}" \
--header 'Content-Type: application/json' \
--data '{
"model": "gemini-omni",
"prompt": "A cinematic product transformation shot with precise camera motion, realistic lighting, and clear visual continuity",
"duration": 5,
"quality": "720p",
"aspect_ratio": "16:9"
}'
🍌 简介
欢迎来到 Gemini Omni API 和提示词仓库!🤗
我们收集了 Google Gemini Omni 在各种创意任务中的高质量提示词和视频示例,涵盖变换、运动、镜头控制、文本序列以及多输入工作流等广泛领域。
本仓库中的大多数案例均来自 DeepMind 官方演示、提示词指南和社区实验。
在 Evolink 上试用:Gemini Omni
如果你觉得有用,不妨给个星标。⭐
[!NOTE]
本仓库专注于在 Evolink 上生成 Gemini Omni 视频时可复用的提示模式与参考案例。
📑 目录
- 🎯 提示词要素
- ✂️ 编辑
- 🎨 高级多模态
- ⚖️ 对比
- 🧪 评估
- 🌐 社区图库
- 🙏 致谢
🎯 提示词要素
Gemini Omni 拥有强大的世界理解能力——它借鉴了历史、科学和文化领域的真实世界知识。你无需过度解释每一个细节。相反,用自然语言表达你的创意意图,让 Omni 的推理能力来补全其余部分。 从零开始创建新视频时,组合以下维度来控制输出:
| 维度 | 指定内容 | 示例 |
|---|---|---|
| 镜头取景与运动 | 广角、中景或特写。相机轨迹:平滑滑行、突然推进、固定锁定、推拉变焦等。 | 缓慢推进的特写跟拍镜头 |
| 风格 | 整体视觉艺术方向 | 复古单色全息图、3D体素艺术、彩色蜡笔美学 |
| 灯光 | 场景氛围与光照设置 | 温暖香槟色灯光、暗淡的健身房顶灯 |
| 地点 | 环境与背景 | 小型地下健身房、未来霓虹城市景观 |
| 动作 | 主体行为与运动 | 人物触摸镜子、弹珠在链式反应轨道上快速滚动 |
[!TIP] 迭代编辑: Omni 支持多轮对话式编辑。它保留有效的部分,只修改你要求的内容——无需每次重新描述整个场景。只需说出下一步要改什么。
[!TIP] 保留未改动区域(作者 @tanabe_fragm): 编辑视频时,在提示词中加入“不要改动其他任何内容”或“保持其他所有部分不变”等短语。这能显著减少视频中你无意修改的部分发生不必要的变化。
https://github.com/user-attachments/assets/285ee7d8-7dfe-4304-a9a4-648026073b80
✂️ 编辑
🔄 元素替换
案例 1:蝴蝶变蜜蜂 🎬 视频→视频
|
输入: https://github.com/user-attachments/assets/8feb4d7b-825d-4a4a-bd9d-900754cf5d38 |
输出: https://github.com/user-attachments/assets/60f31f6d-895e-4048-b477-9a46a5d20b90 |
提示词:
将蝴蝶变成蜜蜂。
案例 2:蜜蜂变萤火虫 🎬 视频→视频
|
输入: https://github.com/user-attachments/assets/60f31f6d-895e-4048-b477-9a46a5d20b90 |
输出: https://github.com/user-attachments/assets/76fc8e97-c7d1-40bc-9e79-bd6705aa8267 |
提示词:
将蜜蜂变成一小群萤火虫。
案例 3-5:飞船与宇航员系列 🎬 视频→视频
提示词:
案例 3:将飞船换成用白色折纸制成的。
案例 4:将宇航员变成海葵。
案例 5:将小船变成鳐鱼。
案例 6:1896 年火车变换(作者 @emollick) 🎬 视频→视频
https://github.com/user-attachments/assets/275cc90e-adaa-48ff-9ff8-1e96ea29d44f
提示词:
我截取了 1896 年著名的“火车”影片,把它变成了子弹头列车、乐高、加了一个时空旅行者、一条蜈蚣、布偶……
案例 7:从视频中移除人物(作者 @arrakis_ai) 🎬 视频→视频
https://github.com/user-attachments/assets/72379fb2-ac30-4d1e-a6b4-143052f8f061
提示词:
完美地从这段视频中移除那个人。
案例 8:隐形小提琴 🎬 视频→视频
|
输入: https://github.com/user-attachments/assets/88176743-d17e-48fe-89f3-528fe60df7fd |
输出: https://github.com/user-attachments/assets/ac6457aa-158c-4a0b-852f-ce1f3367bc3f |
提示词:
让小提琴隐形
案例 9:借助世界知识更换地点(作者 @venturetwins) 🎬 视频→视频
https://github.com/user-attachments/assets/daa90750-fc7b-49ea-b85d-364411159663
提示词:
根据 Google Maps 的截图,在 [地点] 重新拍摄此视频。
上传了一段 Waymo 乘车视频,然后要求 Omni 使用 Google Maps 截图在不同地点重新拍摄。该模型利用其世界知识无缝地改变了环境。
案例 10:动画转实拍(作者 @arrakis_ai) 🎬 视频→视频
https://github.com/user-attachments/assets/3c6be2a9-3e67-4deb-8ccd-fb493b715f65
提示词:
将这段动画变成实拍影像。
🎬 基础场景
案例 1:小提琴家基础镜头 🔤 文字→视频
https://github.com/user-attachments/assets/93de5898-88ee-4bfc-a36f-19d8aa99dfc1
提示词:
一位小提琴家在演奏歌曲的视频。
📷 镜头方向
案例 1:过肩角度 🎬 视频→视频
|
输入: https://github.com/user-attachments/assets/ac6457aa-158c-4a0b-852f-ce1f3367bc3f |
输出: https://github.com/user-attachments/assets/71aa1c8d-0287-4591-b239-68322919293d |
提示词:
将镜头角度改为越过小提琴家的肩膀。
案例 2:镜头从鞋子倾斜到中景 🎬 视频→视频
|
输入: https://github.com/user-attachments/assets/19dbc1ae-1e9e-4b7b-9069-e979fffe3651 |
输出: https://github.com/user-attachments/assets/c0ccbda0-4fd0-42be-8620-db7a67a5347d |
提示词:
改变镜头角度,特写他的鞋子,迅速向上倾斜至中景,然后拉宽。
案例 3:旅行自拍延时(作者 @ZaraIrahh) 🔤 文字→视频
https://github.com/user-attachments/assets/31fa5a56-6113-4376-873b-5e40d26803f1
提示词:
创建一个 10 秒的电影级延时自拍旅行视频,以上传的女性角色为主角,穿越 2026 年的 20 个世界著名目的地。每 0.5 秒一次硬切,与节拍同步。手持自拍杆相机、广角镜头、近距离自拍构图、充满活力的旅行博主风格、鲜艳的电影色彩、逼真的照明、动态运动模糊、自然的熙攘人群以及每个镜头中清晰的地标。
案例 4:时尚无人机航拍(作者 @ariaxawan)🔤 文字→视频
https://github.com/user-attachments/assets/b199a5ab-e008-4a72-aa03-094bc6d573e6
提示词:
一段 10 秒的超电影感、超写实 FPV 时尚无人机航拍,在一条未来感十足的奢华隧道内以单次连续拍摄完成。单次连续拍摄,激进的 FPV 运动,超流畅的电影级飞行路径,奢华高时尚的编辑氛围。
案例 5:俯视图到 360 度旋转(作者 @npaka123)🖼️ 图片→视频
https://github.com/user-attachments/assets/1ad202cb-a485-4b7a-9c8c-d4fea4a3b6d5
提示词:
この教室の中央から黒板を見ているファーストパーソンなゲーム視点。360度カメラを回転。教室の黒板右側の窓の外は廊下、黒板左側の窓の外は校庭。
案例 6:Omnizoom — 潜入一张照片(作者 @alexanderchen)🖼️ 图片→视频
https://github.com/user-attachments/assets/9fd3ad2a-6e4a-4ac0-ab29-48f1c303b95f
提示词:
Omnizoom — 潜入一张照片。
🎬 动作与同步
案例 1:动物玩具声音 🎬 视频→视频
https://github.com/user-attachments/assets/fbf377d7-1b39-43af-92e6-665792d05de0
提示词:
当 <video> 中的手指触摸动物玩具时,播放该动物发出的声音。
案例 2:公寓灯光同步 🎬+🎵 视频+音频→视频
|
输入: https://github.com/user-attachments/assets/6fa879c3-5ee8-4ff1-bbe9-6648d750277d |
输出: https://github.com/user-attachments/assets/3f010e2a-a471-4b0d-8782-c4c5547cd2a5 |
提示词:
公寓的灯光开始随着音乐同步亮起。
案例 3:弹珠连锁反应 🔤 文字→视频
https://github.com/user-attachments/assets/1ece8df7-f29a-4ebd-ad68-9c910f811590
提示词:
一颗弹珠在连锁反应式轨道上快速滚动,连续流畅的镜头。
案例 4:建筑灯光 🎬+🎵 视频+音频→视频
|
输入: https://github.com/user-attachments/assets/efbc0d8d-b64a-4ef9-afe6-fed4a8b66102 |
输出: https://github.com/user-attachments/assets/51727436-1fc2-426b-afaa-86bb63cfba0f |
提示词:
建筑的灯光开始随着音乐同步亮起。
案例 5:拳击对战写实版(作者 @RuzainaMeer)🔤 文字→视频
https://github.com/user-attachments/assets/6796bf78-8bad-441c-889d-30621ee62cd7
提示词:
超写实 10 秒拳击对战,两名女性在一个小型地下拳击馆内进行。两位拳手看起来自然健壮,具有真实的皮肤纹理、汗水、瘀伤和细致的面部表情。打斗感觉原始而真实,如同真实的职业对练录像。摄像机在近距离手持围绕擂台移动,捕捉快速出拳、防守移动、真实步法和沉重呼吸。
🎨 高级多模态
🪞 艺术风格
案例 1-3:镜像系列 🎬 视频→视频
提示词:
案例 1:当人触摸镜子时,让镜子像液体一样美丽地泛起波纹,人的手臂变成反光的镜面材质。
案例 2:当人触摸镜子时,人变成一幅精细的单色线条艺术画。
案例 3:当人触摸镜子时,人突然变成一个可爱的毛毡填充木偶版本,带有大大的凸眼和眼镜。
案例 4:动画广告单镜头(作者 @DenneyDara)🔤 文字→视频
https://github.com/user-attachments/assets/edacf1c5-94db-4687-8eaa-f87ebf5fabee
提示词:
制作一个皮克斯风格的视频,一片芦荟叶在森林中行走,谈论大自然让它感觉多么美好。让它说:“有机健康的成分让我感觉如此良好。”
案例 5:线条画提取(作者 @alexanderchen)🎬 视频→视频
https://github.com/user-attachments/assets/787813c0-2e20-4999-8383-fd76a9b21f91
提示词:
提取此视频中的关键物体。渲染一个视频,将该物体显示为纯白色背景上的黑色示意图式线条画,背景中无其他内容。保持运动和声音完全不变。
✨ 视觉效果
案例 1:手洞超级变焦 🎬 视频→视频
https://github.com/user-attachments/assets/06683ef4-16e0-47b0-93ec-c6222560ee13
提示词:
让我的手洞的奇怪形状看起来像超级变焦并放大了它正对着的地面,画质更清晰。
案例 2:滑板运动效果 🎬 视频→视频
https://github.com/user-attachments/assets/44c120a2-38a7-43d7-89fa-a23d0842078c
提示词:
保持一切不变进行编辑。添加从滑板中发出的动画运动效果。
案例 3:AR HUD 叠加(作者 @jerrod_lew)🎬 视频→视频
https://github.com/user-attachments/assets/04b11cd7-d345-4172-b6e5-38301e73bb77
提示词:
为此录制的手机视频创建一个虚拟 HUD 和 UI 叠加层,类似于带有副屏幕的 AR 眼镜体验。
🔗 跨模态
案例 1:转移到新环境 🎬+🖼️ 视频+图片→视频
|
输入: https://github.com/user-attachments/assets/93de5898-88ee-4bfc-a36f-19d8aa99dfc1 |
输出: https://github.com/user-attachments/assets/88176743-d17e-48fe-89f3-528fe60df7fd |
提示词:
将小提琴手转移到图片所示的环境中。
案例 2:带音频的鸟类形状 🎬+🖼️+🎵 多模态
提示词:
The birds from <video> loosely form the imperfect shape of a bird based on <image>. They move to the music from <audio> and dissipate as they fly
案例 3:Slide to Motion(作者 @yoshifujidesign)🖼️ Image→Video
https://github.com/user-attachments/assets/f07a861b-cd0d-4894-8ef1-b74520c7cbd7
提示词:
GPT image2でスライド作成 → Gemini Omniでモーション。画面遷移もさせられるし、イラストの動かし方も自然。
案例 4:使用参考图像的等距烹饪角色(作者 @kumiko_shiraki)🖼️ Image→Video
https://github.com/user-attachments/assets/d5e9b97e-cefa-4cd8-bf70-4e633020f092
提示词:
Narrow down reference images and add negative prompts to get closer to your ideal output.
技巧:当生成的视频不符合预期时,(1) 缩小参考图像范围,(2) 添加负面提示词以抑制不需要的元素。
案例 5:ChatGPT 指令图像作为输入(作者 @Majin_AppSheet)🖼️ Image→Video
|
输入(来自 ChatGPT 的指令图像):
|
输出: https://github.com/user-attachments/assets/578d6968-c6dd-417a-b6fe-100468851f3d |
工作流:在 ChatGPT 中生成指令/分镜图像,然后直接将它们作为视觉提示输入 Gemini Omni。
案例 6:ChatGPT 插画到 Omni 动画(作者 @mmmiyama_D)🖼️ Image→Video
工作流:使用 ChatGPT 图像生成功能生成插画图 → 用 Gemini Omni 使其动画化。可以通过添加特定提示词来抑制文字扭曲,从而改善文字渲染效果。
📋 分镜
案例 1:奢华化妆品广告(作者 @aiwithaly)🔤 Text→Video
https://github.com/user-attachments/assets/6d003859-eb77-4466-9f70-5a76a2269667
提示词:
Create a cinematic 10-second ultra-realistic luxury cosmetic commercial in a high-end skincare advertisement style. Use warm champagne lighting, glossy beauty-film aesthetic, shallow depth of field, macro beauty cinematography, smooth cinematic camera movement. 10 scenes from macro serum droplets to final payoff shot.
案例 2:在这个故事中展示我 🖼️ Image→Video
|
输入:
|
输出: https://github.com/user-attachments/assets/8429423d-9b72-4cb6-9e8c-985818f160a7 |
提示词:
Show me in this story. Follow the story exactly in order starting top left. Entire story in 10 seconds. Cinematic
案例 3:3x3 分屏(作者 @alexanderchen)🎬 Video→Video
https://github.com/user-attachments/assets/587fc95e-526f-4d8d-94c8-feefe34edba9
提示词:
Generate a 3x3 split screen video based on different details you see here. Make each cell different, varying the perspective, composition, zoom, angle, camera movement (some static, some moving). Make some of the cells extreme close-ups with detailed textures. Keep it photorealistic, handheld, raw. Only natural sounds.
案例 4:不同角度的动作回放(作者 @jerrod_lew)🎬 Video→Video
https://github.com/user-attachments/assets/a1179492-74bd-488c-b594-6bc023269c10
提示词:
Gemini Omni can create action replays from different angles. I referenced a video clip with agent instructions to generate replays.
案例 5:分屏视频(作者 @jerrod_lew)🎬 Video→Video
https://github.com/user-attachments/assets/8755d95d-a9b2-4f7c-a56d-bfbbcc47f80e
提示词:
Use a reference video and ask the agent for a split screen video.
🔤 文字渲染
案例 1:字母表物品序列 🔤 Text→Video
https://github.com/user-attachments/assets/f7693ec2-ac70-4ac8-813f-8fcb46d90d3d
提示词:
The video shows items of the alphabet. An unusual item starting with each letter is shown sitting on a table. All 26 letters must be represented by 26 items with matching lower thirds displaying the letter. Only one item and lower third at a time. Rapid fire, roughly 9 frames per item at 24FPS. Last frame is a slip of paper "THE END".
案例 2:逐词文字同步 🔤 Text→Video
https://github.com/user-attachments/assets/03620abc-bcb2-4011-a52b-ce13409853c4
提示词:
word by word, one word on the screen at a time: did, you, know, that, this, model, can, do, pretty, good, text!? each word appears with a different animated style, perfect pacing to a rhythm, sizzle reel.
案例 3:文字渲染 AI 新闻(作者 @chrisfirst)🔤 Text→Video
https://github.com/user-attachments/assets/e7d23502-1ca0-4f47-be76-47ff05390508
提示词:
Static shot we see them turn the page 3 times. Every flip we see content on both left and right side of book pages. Each contains a big news story around AI for the year of 2025. Include images and crystal clear text.
案例 4:字体时尚秀(作者 @HBCoop_)🔤 Text→Video
https://github.com/user-attachments/assets/395d767c-7d8e-4367-941b-0190da9a0284
提示词:
Create a 10-second avant-garde fashion editorial where every outfit is inspired by a specific Google Font personality. Each second introduces a new model styled around fonts like Playfair Display, Bebas Neue, Orbitron, Pacifico, Rubik Mono One, and Cormorant Garamond. Font names appear integrated into the environment using their exact typography style. High-fashion runway cinematography with bold lighting, mirrored sets, and raw motion.
⚖️ 对比
案例 1:Seedance 2.0 对比 Gemini Omni Flash(来自 @JSFILMZ0412)⚖️ 对比
https://github.com/user-attachments/assets/a03e70b5-99c0-4ad8-b26b-9aed6e037f02
Seedance 2.0 Fast 对比 Gemini Omni Flash —— 风格迁移、运动质量与内容审查对照。
案例 2:Gemini Omni 对比 Seedance 2.0 动作场景(来自 @CuriousRefuge)⚖️ 对比
https://github.com/user-attachments/assets/33e09b7d-2357-481d-8536-dab39e75524b
Gemini Omni 视频编辑模型对比 Seedance 2.0 —— 大型动作场景对照。
🧪 评估
案例 1:Gemini Omni 质量评估(来自 @kenichiota0711)🧪 评估
https://github.com/user-attachments/assets/a9adf476-fac9-4ea2-b5ea-90a50192ccfb
输出几乎完美,令人感动。轻微摇曳的花朵与发丝、眨眼的表现、在笔记本上书写的动作流畅度。
🌐 社区画廊
来自社区的创意实验和作品展示。这些案例展示了 Gemini Omni 所能实现的广泛可能性。
🙏 致谢
本仓库的灵感来源于优秀的公开提示词合集和社区分享的示例。
感谢 Google DeepMind 发布官方 Gemini Omni 演示与提示词指南,使得这些案例研究成为可能。
社区贡献者:
@emollick, @jerrod_lew, @arrakis_ai, @npaka123, @yoshifujidesign, @chrisfirst, @DenneyDara, @ZaraIrahh, @alexanderchen, @ariaxawan, @RuzainaMeer, @aiwithaly, @HBCoop_, @JSFILMZ0412, @CuriousRefuge, @kenichiota0711, @tanabe_fragm, @venturetwins, @kumiko_shiraki, @Majin_AppSheet, @mmmiyama_D, @VORTEX_Promos, @paji_a, @WolfRiccardo, @Dheepanratnam, @iHarnoorSingh, @Strength04_X
如有任何需要更正之处,请联系我们,我们将进行更新。
如果您有更多有趣的提示词案例想要分享,欢迎联系我们,帮助我们扩充 Evolink 提示词库。
