Kling AI 动作控制如何迁移运动？

系统使用骨骼驱动姿态重定向（skeleton-driven pose retargeting）。它首先分析参考视频以构建逐帧骨骼表示——提取身体位置、关节角度、肢体速度和重心数据。然后将此驱动骨骼调整以匹配目标角色图像的比例，确保高个参考表演者的动作能自然映射到较矮或不同比例的角色上。3D 时空关节注意力架构应用物理模拟——重力、动量、重心转移和惯性——使生成的运动符合真实物理规律，而非漂浮或滑动。

动作控制和图生视频有什么区别？

图生视频根据文本描述生成运动——AI 基于提示词预测合理动作，产出每次生成结果不同的概率性输出。动作控制从参考视频复制特定动作——输出是确定性的，精确遵循源素材的编排、时序和空间轨迹。当需要角色执行特定舞蹈、手势序列或体能动作时使用动作控制；当需要 AI 根据文本概念创建原创运动且无参考表演时使用图生视频。

Kling 动作控制视频最长多少秒？

图像方向模式最长 10 秒，该模式将角色锁定在上传图像的原始朝向。视频方向模式最长 30 秒，该模式允许角色跟随参考表演者的方向变化进行转身和旋转。参考视频必须在 3 至 30 秒之间。如果参考视频超出所选方向模式的最大时长，将自动裁剪。

Kling 动作控制支持哪些图像格式？

JPG 和 PNG 图像，每边最小 300 像素，宽高比在 2:5 和 5:2 之间，最大文件大小 10 MB。全身清晰可见、光线充足且遮挡最少的图像可产出最精确的骨骼映射。A-pose 或 T-pose 的源图像能为 AI 提供最清晰的关节参考点。避免严重裁剪或肢体被画框边缘截断的图像——不完整的身体可见度会降低运动迁移保真度。

哪些视频格式可用作动作参考？

MP4 和 MOV 文件，最大 50 MB，时长 3 至 30 秒。单人素材、稳定镜头、连续动作且表演者全身始终在画面内的片段可产出最高质量的运动提取。避免在参考片段中出现快速剪辑、场景切换或多人画面。保持每帧运动路径在 150 像素以内——极端速度或快速空间移动可能导致输出中出现伪影。

720p 和 1080p 模式有什么区别？

720p 标准模式以较低像素密度更快渲染输出——适合测试运动精度、迭代提示词调整和在最终渲染前预览。1080p 高清模式产出更高分辨率的输出，细节更锐利，适合最终生产用途。两种模式使用相同的骨骼驱动运动迁移流水线。运动提取、姿态重定向和物理模拟完全相同——区别仅在于输出像素密度，而非运动保真度。

Kling 动作控制中的角色方向是什么？

角色方向控制输出中角色的朝向。视频方向跟随参考表演者的面向方向——如果他们左转，角色也左转。此模式支持最长 30 秒，适合舞蹈编排、动作序列和包含方向变化的表演。图像方向将角色锁定在上传图像的原始姿势方向，仅应用身体和肢体运动而不改变旋转方向。此模式支持最长 10 秒，适合需要一致朝向的动态海报和循环动画。

哪些类型的动作适用于动作控制？

全身编排（舞蹈编排、健身序列、武术套路），上半身手势（演讲、手语、手部表演），行走和跑步循环，跳跃和落地动作，以及微妙的环境动作（呼吸、摆动、头部倾斜）。系统以物理精度处理承重动作——重击和动量变化在输出中得到反映。已知限制：极速旋转、操控小物体等复杂精细动作任务，以及多人互动可能产生伪影或降低保真度。

Kling 动作控制视频可以商用吗？

可以。通过 Kling 动作控制生成的视频可用于商业用途——营销活动、社交媒体内容、广告、产品演示、客户交付物和教育材料。生成前请确保源图像和参考视频具有适当的使用权限。商业分发权利和内容归属要求在服务条款中详细说明。

Model

提示词

翻译提示词

0 / 2500

参考图片

上传图片

JPG/JPEG/PNG（最大 10MB）

参考图片定义角色、背景和其他元素。尺寸需要 ≥300px，宽高比 2:5–5:2。

参考视频

点击上传或拖放文件

MP4、MOV（最大 50MB）

生成视频中的角色动作将跟随参考视频。

角色朝向

输出质量

Before

After

Kling 动作控制 | AI 视频运动迁移

Q: 什么是 Kling 动作控制？

Kling 动作控制是基于快手视频生成架构构建的运动迁移功能，现在本页同时支持 Kling 2.6 动作控制和 Kling 3.0 动作控制。它从参考视频中提取骨骼运动序列——逐帧映射关节位置、肢体轨迹、手势和动作时序——然后将运动重定向到上传的静态角色图像上。输出是一段角色以帧级精度执行参考素材中完全相同动作的新视频。这与文生视频或图生视频生成有本质区别——后者根据文本提示词预测运动，而非从视频源复制运动。

Kling 动作控制从参考视频中复制精确动作并应用到任意静态图像。与 AI 根据提示词预测运动的文本驱动视频生成不同，动作控制使用骨骼驱动姿态重定向（skeleton-driven pose retargeting）——逐帧提取关节位置、肢体轨迹和时序，然后合成一段角色精确跟随这些动作的新视频。底层的 3D 时空关节注意力架构模拟重心转移、动量和重力，在整个输出时长内产出物理连贯的运动。现已支持 Kling 2.6 动作控制和 Kling 3.0 动作控制。上传角色图像和 3 至 30 秒的参考视频，可生成舞蹈视频、动态海报、角色动画或产品演示，最长 30 秒，分辨率 720p 或 1080p。

全身动作同步

精准手部控制

最长 30 秒视频

720p & 1080p 输出

参考图 + 视频

快速生成

探索图生视频

什么是 Kling 动作控制？

Kling 动作控制是快手的确定性动作迁移系统，现在本页同时支持 Kling 2.6 动作控制和 Kling 3.0 动作控制。它会分析参考视频，提取骨骼运动序列——逐帧映射身体位置、关节角度、肢体速度、手势和面部动作——再将这些运动重定向到你上传的角色图像上，同时根据目标角色的身体比例调整驱动骨骼以确保自然映射。

与标准图生视频生成的技术区别在于运动来源。图生视频模型根据文本描述预测合理运动——输出是概率性的，每次生成结果不同。动作控制从真实视频参考中复制特定动作——输出是确定性的且帧精确。这使其适合需要精确、可重复运动的任务：复制舞蹈编排、演示体能训练、将演讲者手势迁移到插画角色，或创建持续循环播放同一动画的动态海报。

Kling 动作控制核心功能

Kling 动作控制使用骨骼驱动姿态重定向，从参考素材中提取运动并以帧级精度迁移到任意角色图像。

全身骨骼追踪

AI 从参考视频中提取完整的骨骼运动序列——逐帧映射躯干位置、手臂和腿部轨迹、肩部旋转、髋部运动和重心偏移。3D 时空注意力架构模拟重心转移和动量，使参考中的重落地或高跳跃在生成输出中产出物理连贯的冲击效果。

手部和手指精细控制

Kling 动作控制会在整个参考视频中追踪单个手指关节和手部朝向，捕捉大多数 AI 视频模型会模糊或合并的手势。这使得手语序列、计数手势、演奏乐器动作和手指位置承载含义的表现性手部表演的运动迁移成为可能。

3 至 30 秒输出

视频方向模式通过跟随完整参考视频时长生成最长 30 秒的输出。图像方向模式在保留角色原始朝向的同时生成最长 10 秒。接受 3 至 30 秒的参考视频，并根据所选方向模式自动裁剪。

720p 和 1080p 分辨率

720p 标准模式产出更快的输出，用于测试运动精度和迭代提示词调整。1080p 高清模式渲染更高分辨率的细节，用于最终生产用途。两种模式应用相同的骨骼驱动运动迁移流水线——区别在于输出像素密度，而非运动保真度。

文本提示词场景控制

添加文本提示词可在运动保持锁定参考视频的同时修改场景上下文、背景环境、灯光或视觉风格。CFG 引导比例参数控制输出在多大程度上遵循文本提示词与参考运动——较低值优先保证运动精度，较高值赋予提示词描述的场景变化更多权重。

角色方向模式

视频方向跟随参考视频的面向方向——角色以与参考中人物相同的方式转身、旋转和面向。图像方向将角色锁定在上传图像的原始姿势方向，仅应用身体和肢体运动而不改变角色的面向。根据输出是否需要方向旋转来选择。

Kling AI 动作控制工作原理

上传角色图像和参考视频，三步生成运动迁移视频。

上传角色图像

上传角色、插画或主体的 JPG 或 PNG 图像——每边最小 300 像素，最大 10 MB，宽高比在 2:5 和 5:2 之间。全身清晰可见且遮挡最少的图像可产出最精确的骨骼映射。A-pose 或 T-pose 的源图像能为 AI 提供最清晰的关节参考点。

添加参考运动视频

上传展示要迁移动作的 MP4 或 MOV 视频——3 至 30 秒，最大 50 MB。单人素材、稳定镜头和连续动作可产出最高保真度的迁移。AI 从此视频中提取完整的骨骼运动序列并重定向到角色图像上。

生成运动视频

选择分辨率（720p 或 1080p），选择角色方向模式，添加可选文本提示词设定场景上下文，然后生成。处理时间取决于视频长度和分辨率，通常为 2 至 15 分钟。生成完成后下载运动迁移视频。

Kling 动作控制应用场景

AI 动作控制视频生成消除了对传统动作捕捉设备的需求。80% 的动画工作室现已在制作流程中使用 AI，生成式 AI 动画以 39.8% 的年复合增长率增长——受社交媒体、营销和娱乐领域对角色驱动内容的需求推动。

舞蹈视频创作

将编排动作复制到任意角色

录制或获取参考舞蹈视频，上传任意角色图像——插画、吉祥物、AI 生成肖像或产品标志——生成角色执行完全相同编排的视频。Kling 动作控制捕捉脚步、手臂位置、髋部旋转和节奏时序。AI 生成的舞蹈内容在短视频平台上的互动率比静态帖子高 50-300%。

AI 动态海报

以循环动作赋予静态作品生命力

将静态海报、专辑封面和宣传素材转换为带有微妙循环动作的 Kling AI 动态海报——呼吸、摆动、发丝飘动或环境氛围动态。运动迁移保留原始艺术风格和构图，同时添加能让观众在社交信息流和数字标牌显示屏上停留目光的动态元素。

角色动画

无需绑定即可制作动画

将人体动作迁移到插画角色、游戏精灵、产品吉祥物或 AI 生成的形象。动作控制 AI 完全跳过传统的绑定和关键帧流程——录制参考表演，直接应用到任意角色图像。使用 AI 工具的动画工作室报告制作成本降低高达 90%，时间线压缩高达 60%，相比手动角色动画。

产品演示

展示穿戴类和设备的运动效果

通过将人体运动迁移到穿着产品的角色来生成产品演示视频。展示服装垂坠和运动效果、配饰在动作序列中的表现，或带有逼真身体力学的运动装备操作——无需预约模特、摄影棚或每天花费数千美元的动作捕捉场次。

教学动作视频

精确演示动作技巧

为健身训练、瑜伽序列、武术套路、物理治疗练习或舞蹈教程创建教学内容。动作控制 AI 从参考演示中复制精确的关节角度、动作时序和身体定位，实现学习者可以逐步跟随的帧精确技巧可视化。

短视频社交内容

规模化生产热门动作内容

将热门舞蹈动作、反应手势或爆款运动序列应用到品牌角色上，发布到 TikTok、Reels 和 Shorts。87% 的内容创作者现已在创意工作流中使用 AI。动作控制让你以热点传播的速度生产角色驱动的动作内容——从单个参考视频在几分钟内生成多个角色变体。

动作控制 AI 使用指南

参考图指南

Use clear, well-lit images with the full body visible and no cropped limbs
Simple or solid backgrounds help the AI isolate the character skeleton
A-pose or T-pose images provide the clearest joint mapping for most motion types
Match the reference image body proportions to the reference video performer for highest fidelity
使用光线充足、全身清晰可见且肢体未被裁剪的图像
简洁或纯色背景有助于 AI 分离角色骨骼
A-pose 或 T-pose 图像为大多数动作类型提供最清晰的关节映射
参考图的身体比例与参考视频表演者匹配可获得最高保真度

参考视频指南

Use videos with continuous motion and a single performer — multi-person footage may cause skeleton confusion
Stable camera with minimal cuts or scene changes produces the most consistent motion extraction
Keep motion paths under 150 pixels per frame — extreme or rapid movements can cause artifacts
Ensure the performer's full body stays in frame throughout the clip to avoid incomplete skeletal data
使用连续动作和单人表演者的视频——多人素材可能导致骨骼混淆
稳定镜头且无剪辑或场景切换可产出最一致的运动提取
保持每帧运动路径在 150 像素以内——极端或快速移动可能导致伪影
确保表演者全身在整个片段中始终保持在画面内，避免不完整的骨骼数据

技术规格

输入要求

Reference image: JPG or PNG, minimum 300px per side, maximum 10 MB, aspect ratio 2:5 to 5:2
Reference video: MP4 or MOV, 3-30 seconds, maximum 50 MB, single-person footage recommended
Optional text prompt: up to 2,500 characters for scene context and style guidance
Optional negative prompt: up to 2,500 characters to exclude unwanted elements
参考图：JPG 或 PNG，每边最小 300px，最大 10 MB，宽高比 2:5 至 5:2
参考视频：MP4 或 MOV，3-30 秒，最大 50 MB，建议单人素材
可选文本提示词：最多 2,500 字符，用于场景上下文和风格引导
可选反向提示词：最多 2,500 字符，用于排除不需要的元素

输出规格

Resolution: 720p Standard or 1080p HD
Duration: up to 10 seconds (image orientation) or 30 seconds (video orientation)
Format: MP4 video output
Processing time: 2-15 minutes depending on duration and resolution
分辨率：720p 标准或 1080p 高清
时长：最长 10 秒（图像方向）或 30 秒（视频方向）
格式：MP4 视频输出
处理时间：2-15 分钟，取决于时长和分辨率

Kling 动作控制常见问题

关于 Kling 动作控制、AI 动作迁移和参考驱动角色动画的技术解答。

开始创建动作控制视频

上传角色图像和参考运动视频，使用 Kling 动作控制生成帧精确的运动迁移。舞蹈编排、角色动画、动态海报和产品演示——无需绑定、无需动捕设备、无需动画技能。

Kling 动作控制 | AI 视频运动迁移

什么是 Kling 动作控制？

动作控制 AI 使用指南

参考图指南

Use clear, well-lit images with the full body visible and no cropped limbs
Simple or solid backgrounds help the AI isolate the character skeleton
A-pose or T-pose images provide the clearest joint mapping for most motion types
Match the reference image body proportions to the reference video performer for highest fidelity
使用光线充足、全身清晰可见且肢体未被裁剪的图像
简洁或纯色背景有助于 AI 分离角色骨骼
A-pose 或 T-pose 图像为大多数动作类型提供最清晰的关节映射
参考图的身体比例与参考视频表演者匹配可获得最高保真度

参考视频指南

Use videos with continuous motion and a single performer — multi-person footage may cause skeleton confusion
Stable camera with minimal cuts or scene changes produces the most consistent motion extraction
Keep motion paths under 150 pixels per frame — extreme or rapid movements can cause artifacts
Ensure the performer's full body stays in frame throughout the clip to avoid incomplete skeletal data
使用连续动作和单人表演者的视频——多人素材可能导致骨骼混淆
稳定镜头且无剪辑或场景切换可产出最一致的运动提取
保持每帧运动路径在 150 像素以内——极端或快速移动可能导致伪影
确保表演者全身在整个片段中始终保持在画面内，避免不完整的骨骼数据

技术规格

输入要求

Reference image: JPG or PNG, minimum 300px per side, maximum 10 MB, aspect ratio 2:5 to 5:2
Reference video: MP4 or MOV, 3-30 seconds, maximum 50 MB, single-person footage recommended
Optional text prompt: up to 2,500 characters for scene context and style guidance
Optional negative prompt: up to 2,500 characters to exclude unwanted elements
参考图：JPG 或 PNG，每边最小 300px，最大 10 MB，宽高比 2:5 至 5:2
参考视频：MP4 或 MOV，3-30 秒，最大 50 MB，建议单人素材
可选文本提示词：最多 2,500 字符，用于场景上下文和风格引导
可选反向提示词：最多 2,500 字符，用于排除不需要的元素

输出规格

Resolution: 720p Standard or 1080p HD
Duration: up to 10 seconds (image orientation) or 30 seconds (video orientation)
Format: MP4 video output
Processing time: 2-15 minutes depending on duration and resolution
分辨率：720p 标准或 1080p 高清
时长：最长 10 秒（图像方向）或 30 秒（视频方向）
格式：MP4 视频输出
处理时间：2-15 分钟，取决于时长和分辨率

Kling 动作控制 | AI 视频运动迁移

什么是 Kling 动作控制？

Kling 动作控制核心功能

全身骨骼追踪

手部和手指精细控制

3 至 30 秒输出

720p 和 1080p 分辨率

文本提示词场景控制

角色方向模式

Kling AI 动作控制工作原理

上传角色图像

添加参考运动视频

生成运动视频

Kling 动作控制应用场景

舞蹈视频创作

AI 动态海报

角色动画

产品演示

教学动作视频

短视频社交内容

动作控制 AI 使用指南

参考图指南

参考视频指南

技术规格

输入要求

输出规格

相关 AI 视频工具

Kling 动作控制常见问题

什么是 Kling 动作控制？

Kling AI 动作控制如何迁移运动？

动作控制和图生视频有什么区别？

Kling 动作控制视频最长多少秒？

Kling 动作控制支持哪些图像格式？

哪些视频格式可用作动作参考？

720p 和 1080p 模式有什么区别？

Kling 动作控制中的角色方向是什么？

哪些类型的动作适用于动作控制？

Kling 动作控制视频可以商用吗？

开始创建动作控制视频

Kling 动作控制 | AI 视频运动迁移

什么是 Kling 动作控制？

Kling 动作控制核心功能

全身骨骼追踪

手部和手指精细控制

3 至 30 秒输出

720p 和 1080p 分辨率

文本提示词场景控制

角色方向模式

Kling AI 动作控制工作原理

上传角色图像

添加参考运动视频

生成运动视频

Kling 动作控制应用场景

舞蹈视频创作

AI 动态海报

角色动画

产品演示

教学动作视频

短视频社交内容

动作控制 AI 使用指南

参考图指南

参考视频指南

技术规格

输入要求

输出规格

相关 AI 视频工具

Kling 动作控制常见问题

什么是 Kling 动作控制？

Kling AI 动作控制如何迁移运动？

动作控制和图生视频有什么区别？

Kling 动作控制视频最长多少秒？

Kling 动作控制支持哪些图像格式？

哪些视频格式可用作动作参考？

720p 和 1080p 模式有什么区别？

Kling 动作控制中的角色方向是什么？

哪些类型的动作适用于动作控制？

Kling 动作控制视频可以商用吗？

开始创建动作控制视频