小马的 AI 工具集 给 Agent 学习

Omni 提示词

精选 Gemini Omni 视频生成/编辑提示词与案例库,含运镜、风格迁移、文字渲染

Omni 提示词
类型 素材 24 星标 更新 2026-06-15 许可 Other 原仓库 主页

awesome-gemini-omni-api-and-prompt 标志

License: CC BY 4.0 在 Evolink 上试用 模型 API

🇺🇸 English 🇪🇸 Español 🇵🇹 Português 🇯🇵 日本語 🇰🇷 한국어 🇩🇪 Deutsch 🇫🇷 Français 🇹🇷 Türkçe 🇹🇼 繁體中文 🇨🇳 简体中文 🇷🇺 Русский

将 Gemini Omni 提示模式转化为视频生成任务:

模型页面  ·  文档  ·  API 密钥  ·  视频模型  ·  Media MCP

export EVOLINK_API_KEY="your_key_here"

curl --request POST \
  --url https://api.evolink.ai/v1/videos/generations \
  --header "Authorization: Bearer ${EVOLINK_API_KEY}" \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "gemini-omni",
    "prompt": "A cinematic product transformation shot with precise camera motion, realistic lighting, and clear visual continuity",
    "duration": 5,
    "quality": "720p",
    "aspect_ratio": "16:9"
  }'

🍌 简介

欢迎来到 Gemini Omni API 和提示词仓库!🤗
我们收集了 Google Gemini Omni 在各种创意任务中的高质量提示词和视频示例,涵盖变换、运动、镜头控制、文本序列以及多输入工作流等广泛领域。
本仓库中的大多数案例均来自 DeepMind 官方演示、提示词指南和社区实验。
在 Evolink 上试用:Gemini Omni
如果你觉得有用,不妨给个星标。⭐

[!NOTE]
本仓库专注于在 Evolink 上生成 Gemini Omni 视频时可复用的提示模式与参考案例。

📑 目录

🎯 提示词要素

Gemini Omni 拥有强大的世界理解能力——它借鉴了历史、科学和文化领域的真实世界知识。你无需过度解释每一个细节。相反,用自然语言表达你的创意意图,让 Omni 的推理能力来补全其余部分。 从零开始创建新视频时,组合以下维度来控制输出:

维度指定内容示例
镜头取景与运动广角、中景或特写。相机轨迹:平滑滑行、突然推进、固定锁定、推拉变焦等。缓慢推进的特写跟拍镜头
风格整体视觉艺术方向复古单色全息图3D体素艺术彩色蜡笔美学
灯光场景氛围与光照设置温暖香槟色灯光暗淡的健身房顶灯
地点环境与背景小型地下健身房未来霓虹城市景观
动作主体行为与运动人物触摸镜子弹珠在链式反应轨道上快速滚动

[!TIP] 迭代编辑: Omni 支持多轮对话式编辑。它保留有效的部分,只修改你要求的内容——无需每次重新描述整个场景。只需说出下一步要改什么。

[!TIP] 保留未改动区域(作者 @tanabe_fragm): 编辑视频时,在提示词中加入“不要改动其他任何内容”或“保持其他所有部分不变”等短语。这能显著减少视频中你无意修改的部分发生不必要的变化。

https://github.com/user-attachments/assets/285ee7d8-7dfe-4304-a9a4-648026073b80

✂️ 编辑

🔄 元素替换

案例 1:蝴蝶变蜜蜂 🎬 视频→视频

输入:

https://github.com/user-attachments/assets/8feb4d7b-825d-4a4a-bd9d-900754cf5d38

输出:

https://github.com/user-attachments/assets/60f31f6d-895e-4048-b477-9a46a5d20b90

提示词:

将蝴蝶变成蜜蜂。

案例 2:蜜蜂变萤火虫 🎬 视频→视频

输入:

https://github.com/user-attachments/assets/60f31f6d-895e-4048-b477-9a46a5d20b90

输出:

https://github.com/user-attachments/assets/76fc8e97-c7d1-40bc-9e79-bd6705aa8267

提示词:

将蜜蜂变成一小群萤火虫。

案例 3-5:飞船与宇航员系列 🎬 视频→视频

输入:

https://github.com/user-attachments/assets/26ea7e43-9787-4096-82f9-e10543229bec

https://github.com/user-attachments/assets/dd9ae5b1-0205-45ac-a651-258af1c4f12c

案例 3:飞船变白色折纸

https://github.com/user-attachments/assets/78ef5301-b759-4dda-9995-3ee0d259a7b1

案例 4:宇航员变海葵

https://github.com/user-attachments/assets/0cbadb19-8a5b-4a2c-9093-e3a84f3dd988

案例 5:小船变鳐鱼

提示词:

案例 3:将飞船换成用白色折纸制成的。
案例 4:将宇航员变成海葵。
案例 5:将小船变成鳐鱼。

案例 6:1896 年火车变换(作者 @emollick🎬 视频→视频

https://github.com/user-attachments/assets/275cc90e-adaa-48ff-9ff8-1e96ea29d44f

提示词:

我截取了 1896 年著名的“火车”影片,把它变成了子弹头列车、乐高、加了一个时空旅行者、一条蜈蚣、布偶……

案例 7:从视频中移除人物(作者 @arrakis_ai🎬 视频→视频

https://github.com/user-attachments/assets/72379fb2-ac30-4d1e-a6b4-143052f8f061

提示词:

完美地从这段视频中移除那个人。

案例 8:隐形小提琴 🎬 视频→视频

输入:

https://github.com/user-attachments/assets/88176743-d17e-48fe-89f3-528fe60df7fd

输出:

https://github.com/user-attachments/assets/ac6457aa-158c-4a0b-852f-ce1f3367bc3f

提示词:

让小提琴隐形

案例 9:借助世界知识更换地点(作者 @venturetwins🎬 视频→视频

https://github.com/user-attachments/assets/daa90750-fc7b-49ea-b85d-364411159663

提示词:

根据 Google Maps 的截图,在 [地点] 重新拍摄此视频。

上传了一段 Waymo 乘车视频,然后要求 Omni 使用 Google Maps 截图在不同地点重新拍摄。该模型利用其世界知识无缝地改变了环境。


案例 10:动画转实拍(作者 @arrakis_ai🎬 视频→视频

https://github.com/user-attachments/assets/3c6be2a9-3e67-4deb-8ccd-fb493b715f65

提示词:

将这段动画变成实拍影像。

🎬 基础场景

案例 1:小提琴家基础镜头 🔤 文字→视频

https://github.com/user-attachments/assets/93de5898-88ee-4bfc-a36f-19d8aa99dfc1

提示词:

一位小提琴家在演奏歌曲的视频。

📷 镜头方向

案例 1:过肩角度 🎬 视频→视频

输入:

https://github.com/user-attachments/assets/ac6457aa-158c-4a0b-852f-ce1f3367bc3f

输出:

https://github.com/user-attachments/assets/71aa1c8d-0287-4591-b239-68322919293d

提示词:

将镜头角度改为越过小提琴家的肩膀。

案例 2:镜头从鞋子倾斜到中景 🎬 视频→视频

输入:

https://github.com/user-attachments/assets/19dbc1ae-1e9e-4b7b-9069-e979fffe3651

输出:

https://github.com/user-attachments/assets/c0ccbda0-4fd0-42be-8620-db7a67a5347d

提示词:

改变镜头角度,特写他的鞋子,迅速向上倾斜至中景,然后拉宽。

案例 3:旅行自拍延时(作者 @ZaraIrahh🔤 文字→视频

https://github.com/user-attachments/assets/31fa5a56-6113-4376-873b-5e40d26803f1

提示词:

创建一个 10 秒的电影级延时自拍旅行视频,以上传的女性角色为主角,穿越 2026 年的 20 个世界著名目的地。每 0.5 秒一次硬切,与节拍同步。手持自拍杆相机、广角镜头、近距离自拍构图、充满活力的旅行博主风格、鲜艳的电影色彩、逼真的照明、动态运动模糊、自然的熙攘人群以及每个镜头中清晰的地标。

案例 4:时尚无人机航拍(作者 @ariaxawan🔤 文字→视频

https://github.com/user-attachments/assets/b199a5ab-e008-4a72-aa03-094bc6d573e6

提示词:

一段 10 秒的超电影感、超写实 FPV 时尚无人机航拍,在一条未来感十足的奢华隧道内以单次连续拍摄完成。单次连续拍摄,激进的 FPV 运动,超流畅的电影级飞行路径,奢华高时尚的编辑氛围。

案例 5:俯视图到 360 度旋转(作者 @npaka123🖼️ 图片→视频

https://github.com/user-attachments/assets/1ad202cb-a485-4b7a-9c8c-d4fea4a3b6d5

提示词:

この教室の中央から黒板を見ているファーストパーソンなゲーム視点。360度カメラを回転。教室の黒板右側の窓の外は廊下、黒板左側の窓の外は校庭。

案例 6:Omnizoom — 潜入一张照片(作者 @alexanderchen🖼️ 图片→视频

https://github.com/user-attachments/assets/9fd3ad2a-6e4a-4ac0-ab29-48f1c303b95f

提示词:

Omnizoom — 潜入一张照片。

🎬 动作与同步

案例 1:动物玩具声音 🎬 视频→视频

https://github.com/user-attachments/assets/fbf377d7-1b39-43af-92e6-665792d05de0

提示词:

当 <video> 中的手指触摸动物玩具时,播放该动物发出的声音。

案例 2:公寓灯光同步 🎬+🎵 视频+音频→视频

输入:

https://github.com/user-attachments/assets/6fa879c3-5ee8-4ff1-bbe9-6648d750277d

输出:

https://github.com/user-attachments/assets/3f010e2a-a471-4b0d-8782-c4c5547cd2a5

提示词:

公寓的灯光开始随着音乐同步亮起。

案例 3:弹珠连锁反应 🔤 文字→视频

https://github.com/user-attachments/assets/1ece8df7-f29a-4ebd-ad68-9c910f811590

提示词:

一颗弹珠在连锁反应式轨道上快速滚动,连续流畅的镜头。

案例 4:建筑灯光 🎬+🎵 视频+音频→视频

输入:

https://github.com/user-attachments/assets/efbc0d8d-b64a-4ef9-afe6-fed4a8b66102

输出:

https://github.com/user-attachments/assets/51727436-1fc2-426b-afaa-86bb63cfba0f

提示词:

建筑的灯光开始随着音乐同步亮起。

案例 5:拳击对战写实版(作者 @RuzainaMeer🔤 文字→视频

https://github.com/user-attachments/assets/6796bf78-8bad-441c-889d-30621ee62cd7

提示词:

超写实 10 秒拳击对战,两名女性在一个小型地下拳击馆内进行。两位拳手看起来自然健壮,具有真实的皮肤纹理、汗水、瘀伤和细致的面部表情。打斗感觉原始而真实,如同真实的职业对练录像。摄像机在近距离手持围绕擂台移动,捕捉快速出拳、防守移动、真实步法和沉重呼吸。

🎨 高级多模态

🪞 艺术风格

案例 1-3:镜像系列 🎬 视频→视频

https://github.com/user-attachments/assets/747cdc6b-f5fa-4482-b745-2839551e9ba2

案例 1:镜像液态金属波纹

https://github.com/user-attachments/assets/36ea02a2-3716-44aa-9bc2-a5cc1480d0bf

案例 2:镜像线条艺术

https://github.com/user-attachments/assets/dbca6772-dd7a-4418-a0e6-a39796a91c97

案例 3:镜像木偶

提示词:

案例 1:当人触摸镜子时,让镜子像液体一样美丽地泛起波纹,人的手臂变成反光的镜面材质。
案例 2:当人触摸镜子时,人变成一幅精细的单色线条艺术画。
案例 3:当人触摸镜子时,人突然变成一个可爱的毛毡填充木偶版本,带有大大的凸眼和眼镜。

案例 4:动画广告单镜头(作者 @DenneyDara🔤 文字→视频

https://github.com/user-attachments/assets/edacf1c5-94db-4687-8eaa-f87ebf5fabee

提示词:

制作一个皮克斯风格的视频,一片芦荟叶在森林中行走,谈论大自然让它感觉多么美好。让它说:“有机健康的成分让我感觉如此良好。”

案例 5:线条画提取(作者 @alexanderchen🎬 视频→视频

https://github.com/user-attachments/assets/787813c0-2e20-4999-8383-fd76a9b21f91

提示词:

提取此视频中的关键物体。渲染一个视频,将该物体显示为纯白色背景上的黑色示意图式线条画,背景中无其他内容。保持运动和声音完全不变。

✨ 视觉效果

案例 1:手洞超级变焦 🎬 视频→视频

https://github.com/user-attachments/assets/06683ef4-16e0-47b0-93ec-c6222560ee13

提示词:

让我的手洞的奇怪形状看起来像超级变焦并放大了它正对着的地面,画质更清晰。

案例 2:滑板运动效果 🎬 视频→视频

https://github.com/user-attachments/assets/44c120a2-38a7-43d7-89fa-a23d0842078c

提示词:

保持一切不变进行编辑。添加从滑板中发出的动画运动效果。

案例 3:AR HUD 叠加(作者 @jerrod_lew🎬 视频→视频

https://github.com/user-attachments/assets/04b11cd7-d345-4172-b6e5-38301e73bb77

提示词:

为此录制的手机视频创建一个虚拟 HUD 和 UI 叠加层,类似于带有副屏幕的 AR 眼镜体验。

🔗 跨模态

案例 1:转移到新环境 🎬+🖼️ 视频+图片→视频

输入:

https://github.com/user-attachments/assets/93de5898-88ee-4bfc-a36f-19d8aa99dfc1

输出:

https://github.com/user-attachments/assets/88176743-d17e-48fe-89f3-528fe60df7fd

提示词:

将小提琴手转移到图片所示的环境中。

案例 2:带音频的鸟类形状 🎬+🖼️+🎵 多模态

输入视频:

https://github.com/user-attachments/assets/66946870-b366-4981-90b3-c9a35aca69b1

输入图片:

输入音频:

https://github.com/user-attachments/assets/6d79cd06-7805-493c-9f27-6985a3da1866

输出:

https://github.com/user-attachments/assets/a94efea9-14ac-47c2-ab5f-9492400fdc3a

提示词:

The birds from <video> loosely form the imperfect shape of a bird based on <image>. They move to the music from <audio> and dissipate as they fly

案例 3:Slide to Motion(作者 @yoshifujidesign🖼️ Image→Video

https://github.com/user-attachments/assets/f07a861b-cd0d-4894-8ef1-b74520c7cbd7

提示词:

GPT image2でスライド作成 → Gemini Omniでモーション。画面遷移もさせられるし、イラストの動かし方も自然。

案例 4:使用参考图像的等距烹饪角色(作者 @kumiko_shiraki🖼️ Image→Video

https://github.com/user-attachments/assets/d5e9b97e-cefa-4cd8-bf70-4e633020f092

提示词:

Narrow down reference images and add negative prompts to get closer to your ideal output.

技巧:当生成的视频不符合预期时,(1) 缩小参考图像范围,(2) 添加负面提示词以抑制不需要的元素。


案例 5:ChatGPT 指令图像作为输入(作者 @Majin_AppSheet🖼️ Image→Video

输入(来自 ChatGPT 的指令图像):

输出:

https://github.com/user-attachments/assets/578d6968-c6dd-417a-b6fe-100468851f3d

工作流:在 ChatGPT 中生成指令/分镜图像,然后直接将它们作为视觉提示输入 Gemini Omni。


案例 6:ChatGPT 插画到 Omni 动画(作者 @mmmiyama_D🖼️ Image→Video

https://github.com/user-attachments/assets/5759f07e-6b2a-4b7d-bb36-52e960a6559e

https://github.com/user-attachments/assets/b4fea213-9a0e-46c9-8a6e-9e98b566ffab

https://github.com/user-attachments/assets/289e5378-60ad-472b-ba51-da710da81270

工作流:使用 ChatGPT 图像生成功能生成插画图 → 用 Gemini Omni 使其动画化。可以通过添加特定提示词来抑制文字扭曲,从而改善文字渲染效果。

📋 分镜

案例 1:奢华化妆品广告(作者 @aiwithaly🔤 Text→Video

https://github.com/user-attachments/assets/6d003859-eb77-4466-9f70-5a76a2269667

提示词:

Create a cinematic 10-second ultra-realistic luxury cosmetic commercial in a high-end skincare advertisement style. Use warm champagne lighting, glossy beauty-film aesthetic, shallow depth of field, macro beauty cinematography, smooth cinematic camera movement. 10 scenes from macro serum droplets to final payoff shot.

案例 2:在这个故事中展示我 🖼️ Image→Video

输入:

输出:

https://github.com/user-attachments/assets/8429423d-9b72-4cb6-9e8c-985818f160a7

提示词:

Show me in this story. Follow the story exactly in order starting top left. Entire story in 10 seconds. Cinematic

案例 3:3x3 分屏(作者 @alexanderchen🎬 Video→Video

https://github.com/user-attachments/assets/587fc95e-526f-4d8d-94c8-feefe34edba9

提示词:

Generate a 3x3 split screen video based on different details you see here. Make each cell different, varying the perspective, composition, zoom, angle, camera movement (some static, some moving). Make some of the cells extreme close-ups with detailed textures. Keep it photorealistic, handheld, raw. Only natural sounds.

案例 4:不同角度的动作回放(作者 @jerrod_lew🎬 Video→Video

https://github.com/user-attachments/assets/a1179492-74bd-488c-b594-6bc023269c10

提示词:

Gemini Omni can create action replays from different angles. I referenced a video clip with agent instructions to generate replays.

案例 5:分屏视频(作者 @jerrod_lew🎬 Video→Video

https://github.com/user-attachments/assets/8755d95d-a9b2-4f7c-a56d-bfbbcc47f80e

提示词:

Use a reference video and ask the agent for a split screen video.

🔤 文字渲染

案例 1:字母表物品序列 🔤 Text→Video

https://github.com/user-attachments/assets/f7693ec2-ac70-4ac8-813f-8fcb46d90d3d

提示词:

The video shows items of the alphabet. An unusual item starting with each letter is shown sitting on a table. All 26 letters must be represented by 26 items with matching lower thirds displaying the letter. Only one item and lower third at a time. Rapid fire, roughly 9 frames per item at 24FPS. Last frame is a slip of paper "THE END".

案例 2:逐词文字同步 🔤 Text→Video

https://github.com/user-attachments/assets/03620abc-bcb2-4011-a52b-ce13409853c4

提示词:

word by word, one word on the screen at a time: did, you, know, that, this, model, can, do, pretty, good, text!? each word appears with a different animated style, perfect pacing to a rhythm, sizzle reel.

案例 3:文字渲染 AI 新闻(作者 @chrisfirst🔤 Text→Video

https://github.com/user-attachments/assets/e7d23502-1ca0-4f47-be76-47ff05390508

提示词:

Static shot we see them turn the page 3 times. Every flip we see content on both left and right side of book pages. Each contains a big news story around AI for the year of 2025. Include images and crystal clear text.

案例 4:字体时尚秀(作者 @HBCoop_🔤 Text→Video

https://github.com/user-attachments/assets/395d767c-7d8e-4367-941b-0190da9a0284

提示词:

Create a 10-second avant-garde fashion editorial where every outfit is inspired by a specific Google Font personality. Each second introduces a new model styled around fonts like Playfair Display, Bebas Neue, Orbitron, Pacifico, Rubik Mono One, and Cormorant Garamond. Font names appear integrated into the environment using their exact typography style. High-fashion runway cinematography with bold lighting, mirrored sets, and raw motion.

⚖️ 对比

案例 1:Seedance 2.0 对比 Gemini Omni Flash(来自 @JSFILMZ0412⚖️ 对比

https://github.com/user-attachments/assets/a03e70b5-99c0-4ad8-b26b-9aed6e037f02

Seedance 2.0 Fast 对比 Gemini Omni Flash —— 风格迁移、运动质量与内容审查对照。


案例 2:Gemini Omni 对比 Seedance 2.0 动作场景(来自 @CuriousRefuge⚖️ 对比

https://github.com/user-attachments/assets/33e09b7d-2357-481d-8536-dab39e75524b

Gemini Omni 视频编辑模型对比 Seedance 2.0 —— 大型动作场景对照。

🧪 评估

案例 1:Gemini Omni 质量评估(来自 @kenichiota0711🧪 评估

https://github.com/user-attachments/assets/a9adf476-fac9-4ea2-b5ea-90a50192ccfb

输出几乎完美,令人感动。轻微摇曳的花朵与发丝、眨眼的表现、在笔记本上书写的动作流畅度。

🌐 社区画廊

来自社区的创意实验和作品展示。这些案例展示了 Gemini Omni 所能实现的广泛可能性。

概念驱动型教育视频 —— 来自 @VORTEX_Promos

https://github.com/user-attachments/assets/ca450aec-a6c8-455f-973d-087bfb3da742

展示作品 —— 来自 @paji_a

https://github.com/user-attachments/assets/8ecfe4b0-6de7-47f0-9b83-3dc736512e54

Nano Banana 视频 —— 一致性测试 —— 来自 @WolfRiccardo

https://github.com/user-attachments/assets/0cabc195-8a2b-47e6-a649-d95b15003964

等距角色展示 —— 来自 @kumiko_shiraki

https://github.com/user-attachments/assets/d38627cd-6f23-4ea3-8a95-7cd831229364

一句话的禅意电影 —— 来自 @Dheepanratnam

https://github.com/user-attachments/assets/d33d9c9d-a68f-4e01-bf1e-c4c8ee60c8ee

角色变身 —— 华丽到日常 —— 来自 @HBCoop_

https://github.com/user-attachments/assets/239ca343-cb71-4254-8478-d8947d6c33aa

Waymo 来到印度 —— 来自 @iHarnoorSingh

https://github.com/user-attachments/assets/7d23ad1f-63bf-4a3c-ab94-09e8f26c570e

未寄出的信 —— 微电影 —— 来自 @Strength04_X

https://github.com/user-attachments/assets/df8dcb7c-c918-4fc2-b952-0cb2bcdddfee

🙏 致谢

本仓库的灵感来源于优秀的公开提示词合集和社区分享的示例。

感谢 Google DeepMind 发布官方 Gemini Omni 演示与提示词指南,使得这些案例研究成为可能。

社区贡献者:

@emollick, @jerrod_lew, @arrakis_ai, @npaka123, @yoshifujidesign, @chrisfirst, @DenneyDara, @ZaraIrahh, @alexanderchen, @ariaxawan, @RuzainaMeer, @aiwithaly, @HBCoop_, @JSFILMZ0412, @CuriousRefuge, @kenichiota0711, @tanabe_fragm, @venturetwins, @kumiko_shiraki, @Majin_AppSheet, @mmmiyama_D, @VORTEX_Promos, @paji_a, @WolfRiccardo, @Dheepanratnam, @iHarnoorSingh, @Strength04_X

如有任何需要更正之处,请联系我们,我们将进行更新。

如果您有更多有趣的提示词案例想要分享,欢迎联系我们,帮助我们扩充 Evolink 提示词库。

Star History Chart

在 GitHub 查看完整项目