⚠Soraモデルは高負荷のため現在不安定です。生成が失敗したり、通常より時間がかかる場合があります。
この画像が動画の開始フレームになります
0 / 5000
AIオーディオ付きで動画を生成(センシティブなコンテンツでは音声が無効になる場合があります)
画像から動画 AI生成器 — Gemini Nano Banana
画像から動画AIは、異なる画像条件付けアプローチを持つ3つの動画モデルで静止画像をHD動画と同期オーディオに変換します。Google DeepMindのVeo 3.1は首尾フレーム補間(keyframe interpolation)に対応 — 開始画像とオプションの終了画像をアップロードし、2つのキーフレーム間の滑らかな動きを生成。参考画像(最大3枚)でシーン間のキャラクター・スタイル一貫性を維持。OpenAIのSora 2は画像条件付き拡散(image-conditioned diffusion)を使用 — 入力写真を時空オートエンコーダでエンコードし潜在動画表現に結合、ソースコンテンツを保持しつつ最大20秒の物理的に正確な動きを生成。快手のKling 2.6はMotion Brush — 画像上に直接モーションパスを描画し最大6要素を同時に制御 — と音素レベル解析(phoneme-level analysis)によるフレームパーフェクトリップシンクのフェイスリアクトメントを提供 — Gemini Nano Banana。
画像アニメーション用AI動画モデル — Gemini Nano Banana
3つの画像から動画AIモデルを搭載。各モデルは異なる画像条件付けアプローチ — キーフレーム補間、潜在結合、モーションパス制御。
Veo 3.1
Google DeepMind
キーフレーム補間+オーディオ
Veo 3.1は画像から動画で首尾フレーム補間に対応 — 開始画像とオプションの終了画像をアップロードし、2つのキーフレーム間の滑らかな動きを生成。参考画像モードは最大3枚で複数生成間のキャラクター・スタイル一貫性を維持。結合オーディオ・動画拡散でアニメーションシーンに合わせたセリフ、効果音、環境音を同期生成。
- First/Last Frame Control
- Reference Images (1-3)
- Native Audio Generation
- Up to 1080p / 24 FPS
- 首尾フレーム制御
- 参考画像(1〜3枚)
- ネイティブオーディオ生成
- 最大1080p / 24 FPS
Sora 2
OpenAI
物理的に正確なアニメーション
Sora 2は画像条件付き拡散を使用 — 入力写真を時空オートエンコーダでエンコードし潜在動画表現に結合。拡散Transformerがソース画像のコンテンツ、被写体、構図を保持しつつ動きを生成。シーン間補間用に最大2枚の入力画像に対応。画像条件ドロップアウトによる統一学習で同一アーキテクチャがテキストから動画と画像から動画の両方を処理。
- Image-Conditioned DiT
- Up to 2 Input Images
- Up to 1080p / 30 FPS
- Synchronized Audio
- 画像条件付きDiT
- 最大2枚の入力画像
- 最大1080p / 30 FPS
- 同期オーディオ
Kling 2.6
Kuaishou
Motion Brush+フェイスアニメーション
Kling 2.6は画像から動画で最も細かな制御を提供。Motion Brushで画像上に直接モーションパスを描画し、最大6要素をそれぞれ独立した方向と速度で同時アニメーション化。ポートレートにはフェイスリアクトメントが音素解析と3D時空アテンションでフレームパーフェクトリップシンクを実現 — 顔の微表情、自然な頭部動作、視線追跡を生成。
- Motion Brush (6 Elements)
- Face Reenactment + Lip-Sync
- EN/CN Voice Synthesis
- Fastest Generation
- Motion Brush(6要素)
- フェイスリアクトメント+リップシンク
- 英語/中国語音声合成
- 最速生成
AI写真動画化 — Gemini Nano Banana
画像をアップロードしてAI動画に変換。Veo 3.1は首尾フレーム間を補間し結合オーディオを生成。Sora 2は写真を潜在空間にエンコードし最大20秒の物理的に正確な動きを生成。Kling 2.6はMotion Brushでモーションパスを描画し、音素レベルリップシンクでポートレートをアニメーション化。全モデルが同期AIオーディオ付きHD動画を生成 — Gemini Nano Banana。
写真動画化AIの活用例 — Gemini Nano Banana
AI生成動画の38%が画像から動画技術で既存写真をアニメーション化。動画付き商品は画像のみより60〜86%高いコンバージョン率。3つのモデルが異なる画像アニメーション強みでワークフローに対応。
写真アニメーション
AI動作で静止写真に命を吹き込む
静止写真をダイナミックな動画クリップに変換。Veo 3.1の首フレーム条件付けが元画像を保持しつつ、同期オーディオ付きの自然なカメラワークと被写体動作を生成。商品動画付きEコマースサイトは静止画像の3倍のエンゲージメント、商品ページ滞在時間が88%増加 — Gemini Nano Banana。
商品ショーケース
Eコマース用に商品写真をアニメーション化
商品写真を回転ショーケース動画に変換。Veo 3.1の首尾フレーム制御で2つのアングルから精密な360度回転を実現。カート追加率は動画で64%増加、返品率は顧客が動的デモで商品を理解することで40〜50%減少 — Gemini Nano Banana。
ポートレートアニメーション
ポートレートをトーキング動画に変換
ポートレート写真をKling 2.6のフェイスリアクトメントで表情豊かなトーキングヘッド動画に変換。音素レベル解析で自然な顔の微表情、頭部動作、視線追跡を伴うフレームパーフェクトリップシンクを生成。英語・中国語ネイティブ音声合成で1枚のポートレートから多言語アバターコンテンツを作成 — Gemini Nano Banana。
アートアニメーション
イラストやアートワークをアニメーション化
アートワークやイラストに命を吹き込む。Sora 2の画像条件付き拡散が芸術スタイルと色彩パレットを保持しつつ物理的に正確な動きを生成 — 筆致が流れ、キャラクターが動き、環境が変化。Veo 3.1の参考モードでアニメシリーズの複数生成間の視覚一貫性を維持 — Gemini Nano Banana。
メモリー動画
家族写真を動画ストーリーに変換
家族写真や旅行スナップをシネマティックな動画クリップに変換。Veo 3.1がアニメーションシーンに合わせた同期環境音(鳥の声、波、風、街の音)を生成。複数の生成をつなぎ合わせてフォトコレクションから長尺ナラティブシーケンスを作成 — Gemini Nano Banana。
SNSコンテンツ
写真からスクロールストップ投稿を作成
写真からスクロールストップSNS動画を生成。Kling 2.6のMotion Brushでアニメーション要素を正確に制御 — 髪、衣服、背景、小道具など最大6要素を独立したモーションパスで個別に動作。AI生成動画を使用する企業の73%がエンゲージメント率の測定可能な増加を報告 — Gemini Nano Banana。
画像から動画AIの使い方 — Gemini Nano Banana
写真からAI動画生成まで3ステップ。
画像をアップロード
JPG、PNG、WebPの写真をアップロード。オプションで終了フレーム(Veo 3.1キーフレーム補間用)やスタイル一貫性の参考画像を追加可能。AIが被写体、奥行き、ライティング、構図を分析してリアルな動きを計画。
動きを記述
画像のアニメーション方法を記述 — 被写体の動き、カメラパス、環境効果、オーディオキュー。精密制御にはKling 2.6のMotion Brushで画像上に直接モーションパスを描画し、最大6要素の方向と速度を定義。
生成してダウンロード
HD動画を生成しダウンロード。モデル間で比較 — Veo 3.1は結合潜在拡散のシネマティックオーディオシーン、Sora 2は最大20秒の物理精度モーション、Kling 2.6はMotion Brush精密制御と最速生成。
画像から動画プロンプト例 — Gemini Nano Banana
効果的な画像から動画プロンプトは動きの方向、速度、カメラワーク、アニメーション対象要素を記述。ソース画像がビジュアルコンテンツを提供 — プロンプトは動き方をガイド。
ファッションランウェイウォーク
Kling 2.6 — Motion Brushで6要素をアニメーション化:脚、腕、髪、ドレスの裾、イヤリング、背景
"Model begins walking forward on a fashion runway. Legs stride in smooth, confident rhythm. Arms swing naturally at sides. Silk dress hem sways with each step. Hair bounces slightly with momentum. Earrings catch and release light. Audience blurred in background. Front-facing camera, editorial runway photography, dramatic top-lighting."
ダイヤモンドリング マクロリビール
Sora 2 — 画像条件付き拡散で宝石のディテールを保持しつつリアルな光屈折を生成
"Diamond engagement ring slowly rotates on a dark velvet surface. Light refracts through the stone, casting rainbow prismatic patterns on the fabric. Tiny sparkling reflections dance across facets as the angle changes. Camera pushes in from medium to extreme macro. Luxurious, high-end commercial, black background with single spot light."
山岳サンライズパノラマ
Veo 3.1 — 夜明け前からゴールデンアワーへの首尾フレーム補間
"Snow-capped mountain range transitions from pre-dawn blue to golden sunrise. Light gradually spills across valleys, shadows retreating down slopes. Thin clouds drift slowly across peaks. A river in the foreground catches the changing light. Camera slowly pulls back revealing the full panorama. Ambient wind and distant birdsong. Nature documentary, wide-angle landscape photography."
猫の目覚めストレッチ
Kling 2.6 — Motion Brushで微細動作:呼吸、耳の動き、目の開き、前脚ストレッチ
"Tabby cat lying on a sunlit window cushion begins to wake. Chest rises and falls with gentle breathing. One ear twitches. Eyes slowly open, pupils adjusting to light. Front paws extend forward in a long stretch, toes spreading. Whiskers quiver. Warm afternoon light streams through sheer curtains. Cozy, intimate, lifestyle photography with shallow depth of field."
画像から動画プロンプトTips — Gemini Nano Banana
- • コンテンツではなく動きを記述 - ソース画像がビジュアルを提供 — プロンプトは要素の動き方に集中。アニメーションしたい各要素の方向、速度、タイミングを指定。
- • 精密制御にMotion Brushを活用 - Kling 2.6のMotion Brushで画像上に直接モーションパスを描画 — 最大6要素をそれぞれ独立した方向と速度で制御。テキストプロンプトだけでは表現できない正確な動きに使用。
- • 制御のため終了フレームをアップロード - Veo 3.1の首尾フレームモードは2枚の画像間の動きを補間。開始・終了写真をアップロードして精密なアニメーションパスを指定 — 商品回転、カメラワーク、シーン遷移に最適。
- • 画像品質を出力に合わせる - 最適な結果には1024×1024ピクセル以上の高解像度画像をJPG、PNG、WebPでアップロード。AIは入力アスペクト比を保持 — YouTube用16:9、TikTok/リール用9:16、正方形投稿用1:1。
画像から動画AIモード — Gemini Nano Banana
2つのアニメーションモード — フレームモードで精密キーフレーム制御、参考モードでスタイルガイド生成。
フレームから動画
画像を開始フレームとしてアップロード。オプションで終了フレームを追加 — モデルが2つのキーフレーム間で滑らかな物理認識モーションを補間。Veo 3.1の首尾フレーム制御は商品回転、カメラパスアニメーション、精密な開始・終了状態のシーン遷移に最適 — Gemini Nano Banana。
- First frame preserved as video opening
- Optional end frame for keyframe interpolation
- All models, quality modes, and aspect ratios supported
- 首フレームが動画冒頭として保持
- オプション終了フレームでキーフレーム補間
- 全モデル、品質モード、アスペクト比に対応
参考画像から動画
画像をスタイル・キャラクター参考として使用。Veo 3.1は最大3枚の参考画像に対応 — キャラクター外見、色彩パレット、芸術スタイルのシーン間視覚一貫性を維持しつつ新しい動画コンテンツを生成 — Gemini Nano Banana。
- Upload 1-3 reference images for style guidance
- Maintains character and visual consistency
- Generates new creative video content from references
- スタイルガイダンスに1〜3枚の参考画像
- キャラクター・ビジュアル一貫性を維持
- 参考からクリエイティブな動画コンテンツを生成
その他のAIツール — Gemini Nano Banana
画像から動画 AI FAQ — Gemini Nano Banana
画像から動画AI生成に関するよくある質問。
AIで写真をアニメーション化 — Gemini Nano Banana
キーフレーム補間、画像条件付き拡散、Motion Brush制御 — 3つの画像条件付けアプローチを一つの写真動画化プラットフォームに統合。写真をアップロード、動きを記述、AIオーディオ付きHD動画を生成。