⚠Sora 模型因负载过高目前不稳定,生成可能失败或耗时更长。
此图片将作为视频的起始帧
0 / 5000
生成带有 AI 音频的视频(敏感内容可能禁用音频)
图生视频 AI 生成器 — Gemini Nano Banana
Gemini Nano Banana 图生视频是一个 AI 照片转视频生成器,使用三个视频模型将静态图像动画为带同步音频的高清视频,每个模型具有不同的图像条件化方式。Google DeepMind 的 Veo 3.1 支持首尾帧插值——上传起始图像和可选的结束图像,模型在两个关键帧之间生成平滑运动,参考图(最多 3 张)用于跨场景的角色和风格一致性。OpenAI 的 Sora 2 使用图像条件化扩散(image-conditioned diffusion),将输入照片通过时空自编码器编码并拼接到潜视频表示中,使扩散变换器在保留源内容的同时生成长达 20 秒的物理精确运动。快手的 Kling 2.6 提供 Motion Brush——直接在图像上绘制运动路径,同时控制最多 6 个独立元素——以及面部重演功能,通过音素级分析实现逐帧精确唇同步的肖像动画。
图像动画 AI 视频模型 — Gemini Nano Banana
三个图生视频 AI 模型,尽在 Gemini Nano Banana。每个模型使用不同的图像条件化方式——关键帧插值、潜空间拼接或运动路径控制。
Veo 3.1
Google DeepMind
关键帧插值 + 音频
Veo 3.1 支持图生视频的首尾帧插值——上传起始图像和可选的结束图像,模型在两个关键帧之间生成平滑运动。参考图模式接受最多 3 张图像,用于多次生成间的角色和风格一致性。联合音视频扩散产出与动画场景匹配的同步对话、音效和环境音频。
- First/Last Frame Control
- Reference Images (1-3)
- Native Audio Generation
- Up to 1080p / 24 FPS
- 首尾帧控制
- 参考图(1-3 张)
- 原生音频生成
- 最高 1080p / 24 FPS
Sora 2
OpenAI
物理精确动画
Sora 2 使用图像条件化扩散——将输入照片通过时空自编码器编码并拼接到潜视频表示中。扩散变换器在保留源图像内容、主体和构图的同时生成运动。接受最多 2 张输入图像用于场景间插值。统一训练配合图像条件丢弃使同一架构同时处理文生视频和图生视频。
- Image-Conditioned DiT
- Up to 2 Input Images
- Up to 1080p / 30 FPS
- Synchronized Audio
- 图像条件化 DiT
- 最多 2 张输入图像
- 最高 1080p / 30 FPS
- 同步音频
Kling 2.6
快手
Motion Brush + 面部动画
Kling 2.6 为图生视频提供最精细的控制——Motion Brush 支持直接在图像上绘制运动路径,同时动画最多 6 个独立元素,各自拥有独立的方向和速度。对于肖像,面部重演使用音素分析和 3D 时空注意力实现来自音频输入的逐帧精确唇同步,生成面部微表情、自然头部运动和视线追踪。
- Motion Brush (6 Elements)
- Face Reenactment + Lip-Sync
- EN/CN Voice Synthesis
- Fastest Generation
- Motion Brush(6 元素)
- 面部重演 + 唇同步
- 英中语音合成
- 最快生成
AI 照片转视频生成器 — Gemini Nano Banana
上传图像并使用图生视频 AI 进行动画,尽在 Gemini Nano Banana。Veo 3.1 在首尾帧之间插值并联合生成音频。Sora 2 将照片编码到潜空间并推演出自然运动。Kling 2.6 通过 Motion Brush 将精细运动路径应用到图像的隔离区域。三种图像条件化方式——关键帧插值、潜空间拼接和运动路径控制——集于一个浏览器端平台。上传照片、撰写提示词并选择模型即可获得可下载的动画视频。
照片转视频 AI 用例 — Gemini Nano Banana
38% 的 AI 生成视频使用图生视频技术为现有照片添加动效。带视频的产品转化率比纯图片高 60-86%。Gemini Nano Banana 以模型专属图像动画方式支持从轻量社交内容到精品电影级输出。
照片动画
用 AI 运动让静态照片活起来
使用 Gemini Nano Banana 图生视频 AI 将静态照片动画为动态视频片段。Veo 3.1 首帧条件化保留原始图像的同时生成自然镜头运动和主体动态及同步音频。使用产品视频的电商网站相比静态图片获得 3 倍互动率,产品页停留时间增加 88%。
产品展示
为电商动画产品照片
在 Gemini Nano Banana 上将产品照片转化为旋转展示视频。Veo 3.1 首尾帧控制支持精确的 360 度旋转——从两个角度上传产品,模型插值运动路径。带视频的产品加入购物车率增加 64%,退货率降低 40-50%,因为客户通过动态演示更好地了解产品。
肖像动画
将肖像照片转化为说话视频
使用 Gemini Nano Banana 上 Kling 2.6 的面部重演将肖像照片转化为富有表情的说话头像视频。音素级分析生成逐帧精确的唇同步,伴随自然面部微表情、头部运动和视线追踪。原生英中语音合成从单张肖像照片创建多语言头像内容。
艺术动画
为插画和艺术作品添加动效
使用 Gemini Nano Banana AI 图生视频让艺术作品和插画活起来。Sora 2 图像条件化扩散在生成物理精确运动的同时保留艺术风格和色彩方案——笔触流动,角色运动,环境变化。Veo 3.1 的参考模式在多次生成间保持视觉一致性,适合动画系列。
回忆视频
将家庭照片动画为视频故事
使用 Gemini Nano Banana 照片转视频 AI 将家庭照片和旅行快照转化为电影级视频片段。Veo 3.1 生成与动画场景匹配的同步环境音频——鸟鸣、海浪、风声、街道声。将多次生成串联为照片集的更长叙事序列。
社交内容
从照片创建吸引眼球的帖子
使用 Gemini Nano Banana 图生视频 AI 生成器从照片生成令人驻足的社交媒体视频。Kling 2.6 Motion Brush 支持精确控制哪些元素运动——隔离最多 6 个元素(如头发、服装、背景和道具),各自设定独立运动路径。73% 使用 AI 生成视频的企业报告互动率有可衡量的提升。
图片转视频 AI 工作原理 — Gemini Nano Banana
从照片到可下载 AI 视频的三个步骤,尽在 Gemini Nano Banana。
上传图像
将 JPG、PNG 或 WebP 格式的照片上传到 Gemini Nano Banana 图生视频 AI。可选添加尾帧用于关键帧插值(Veo 3.1)或参考图用于风格一致性。AI 分析主体、深度、光照和构图来规划逼真的运动。
描述运动
编写描述图像如何动画的提示词——主体运动、镜头路径、环境效果和音频线索。对于精确控制,使用 Kling 2.6 Motion Brush 直接在照片上绘制运动路径,为最多 6 个独立元素定义方向和速度。
生成并下载
生成视频并下载高清。跨模型对比结果——Veo 3.1 用于联合潜空间扩散的电影级音频场景,Sora 2 用于长达 20 秒的物理精确运动,Kling 2.6 用于 Motion Brush 精准控制和最快生成速度的肖像动画。
图生视频提示词示例 — Gemini Nano Banana
有效的图生视频提示词描述运动方向、速度、镜头运动以及哪些元素应该动起来。源图像提供视觉内容——提示词引导它如何运动。
时尚走秀
Kling 2.6——Motion Brush 动画 6 个元素:腿、手臂、头发、裙摆、耳环、背景
"模特开始在时尚秀场上向前走。双腿以流畅自信的节奏迈步。手臂在身侧自然摆动。丝绸裙摆随每一步摇曳。头发因动量微微弹跳。耳环捕捉和释放光线。观众在背景中虚化。正面镜头,编辑级走秀摄影,戏剧性顶光。"
钻石戒指微距展示
Sora 2——图像条件化扩散在生成逼真光折射的同时保留宝石细节
"钻石订婚戒指在深色天鹅绒表面上缓慢旋转。光线穿过宝石折射,在织物上投射彩虹棱镜图案。随着角度变化,微小闪烁的反射在切面上舞动。镜头从中景推入极致微距。奢华、高端商业风,黑色背景配单点光源。"
山脉日出全景
Veo 3.1——黎明前到黄金时刻的首尾帧插值
"雪冠山脉从黎明前的蓝色过渡到金色日出。光线逐渐洒过山谷,阴影沿山坡退去。薄云缓缓飘过山峰。前景的河流捕捉变化的光线。镜头缓慢后拉展示全景。环境风声和远处鸟鸣。自然纪录片,广角风景摄影。"
猫咪伸懒腰醒来
Kling 2.6——Motion Brush 用于微妙微运动:呼吸、耳朵抽动、眼睛睁开、爪子伸展
"虎斑猫躺在阳光照射的窗台垫子上开始醒来。胸部随轻柔呼吸起伏。一只耳朵抽动。眼睛缓慢睁开,瞳孔适应光线。前爪向前伸展成长长的拉伸,脚趾张开。胡须颤动。温暖的午后光线透过薄纱窗帘流入。温馨、私密、生活方式摄影配浅景深。"
图生视频提示词技巧 — Gemini Nano Banana
- • 描述运动,而非内容 - 源图像提供视觉内容——提示词应聚焦于元素如何运动,而非它们的外观。为每个要动画的元素指定方向、速度和时序
- • 使用 Motion Brush 精确控制 - Kling 2.6 Motion Brush 支持直接在图像上绘制运动路径——隔离最多 6 个元素,各自独立方向和速度。当文字提示词无法表达你想要的精确运动时使用此功能
- • 上传尾帧进行控制 - Veo 3.1 首尾帧模式在两张图像之间插值运动。上传起始和结束照片以获得精确的动画路径——适合产品旋转、镜头运动和场景过渡
- • 图像质量匹配输出 - 上传高分辨率图像(最低 1024×1024 像素),格式为 JPG、PNG 或 WebP。AI 保留输入的宽高比——16:9 用于 YouTube,9:16 用于 TikTok 和 Reels,1:1 用于方形帖子
图生视频 AI 模式 — Gemini Nano Banana
两种动画模式——帧模式用于精确关键帧控制,参考模式用于风格引导生成,尽在 Gemini Nano Banana。
帧转视频
在 Gemini Nano Banana 上将图像作为图生视频 AI 的起始帧上传。可选添加尾帧——模型在两个关键帧之间插值平滑的、感知物理的运动。Veo 3.1 首尾帧控制适合具有精确起始和结束状态的产品旋转、镜头路径动画和场景过渡。
- First frame preserved as video opening
- Optional end frame for keyframe interpolation
- All models, quality modes, and aspect ratios supported
- 首帧保留为视频开头
- 可选尾帧用于关键帧插值
- 支持所有模型、画质模式和宽高比
参考转视频
在 Gemini Nano Banana 上使用图像作为 AI 图生视频的风格和角色参考。Veo 3.1 接受最多 3 张参考图——模型生成新视频内容的同时保持与参考在角色外观、色彩方案和艺术风格方面的视觉一致性。
- Upload 1-3 reference images for style guidance
- Maintains character and visual consistency
- Generates new creative video content from references
- 上传 1-3 张参考图用于风格引导
- 保持角色和视觉一致性
- 从参考生成新创意视频内容
更多 AI 工具 — Gemini Nano Banana
图生视频 AI 常见问题 — Gemini Nano Banana
关于图生视频 AI 的常见问题 — Gemini Nano Banana。
用 AI 为任意照片添加动效 — Gemini Nano Banana
三种图像条件化方式——关键帧插值、图像条件化扩散和 Motion Brush 控制——集于一个照片转视频平台。上传照片,描述运动,获得可下载视频,尽在 Gemini Nano Banana。