0 / 2500
参考图片定义角色、背景和其他元素。尺寸需要 ≥300px,宽高比 2:5–5:2。
Kling 动作控制 | AI 视频运动迁移
Kling 动作控制从参考视频中复制精确动作并应用到任意静态图像。与 AI 根据提示词预测运动的文本驱动视频生成不同,动作控制使用骨骼驱动姿态重定向(skeleton-driven pose retargeting)——逐帧提取关节位置、肢体轨迹和时序,然后合成一段角色精确跟随这些动作的新视频。底层的 3D 时空关节注意力架构模拟重心转移、动量和重力,在整个输出时长内产出物理连贯的运动。上传角色图像和 3 至 30 秒的参考视频,可生成舞蹈视频、动态海报、角色动画或产品演示,最长 30 秒,分辨率 720p 或 1080p。
什么是 Kling 2.6 动作控制?
Kling 2.6 动作控制是基于快手视频生成架构构建的确定性运动迁移系统。它分析参考视频以提取骨骼运动序列——逐帧映射身体位置、关节角度、肢体速度、手势和面部动作。然后将提取的运动重定向到上传的角色图像上,根据目标角色的身体比例调整驱动骨骼。最终输出的视频中,角色执行参考素材中完全相同的编排、手势序列或动作,全程保持解剖学上连贯的关节运动。
与标准图生视频生成的技术区别在于运动来源。图生视频模型根据文本描述预测合理运动——输出是概率性的,每次生成结果不同。动作控制从真实视频参考中复制特定动作——输出是确定性的且帧精确。这使其适合需要精确、可重复运动的任务:复制舞蹈编排、演示体能训练、将演讲者手势迁移到插画角色,或创建持续循环播放同一动画的动态海报。
Kling 动作控制核心功能
Kling 2.6 动作控制使用骨骼驱动姿态重定向,从参考素材中提取运动并以帧级精度迁移到任意角色图像。
全身骨骼追踪
AI 从参考视频中提取完整的骨骼运动序列——逐帧映射躯干位置、手臂和腿部轨迹、肩部旋转、髋部运动和重心偏移。3D 时空注意力架构模拟重心转移和动量,使参考中的重落地或高跳跃在生成输出中产出物理连贯的冲击效果。
手部和手指精细控制
Kling 2.6 在整个参考视频中追踪单个手指关节和手部朝向,捕捉大多数 AI 视频模型会模糊或合并的手势。这使得手语序列、计数手势、演奏乐器动作和手指位置承载含义的表现性手部表演的运动迁移成为可能。
3 至 30 秒输出
视频方向模式通过跟随完整参考视频时长生成最长 30 秒的输出。图像方向模式在保留角色原始朝向的同时生成最长 10 秒。接受 3 至 30 秒的参考视频,并根据所选方向模式自动裁剪。
720p 和 1080p 分辨率
720p 标准模式产出更快的输出,用于测试运动精度和迭代提示词调整。1080p 高清模式渲染更高分辨率的细节,用于最终生产用途。两种模式应用相同的骨骼驱动运动迁移流水线——区别在于输出像素密度,而非运动保真度。
文本提示词场景控制
添加文本提示词可在运动保持锁定参考视频的同时修改场景上下文、背景环境、灯光或视觉风格。CFG 引导比例参数控制输出在多大程度上遵循文本提示词与参考运动——较低值优先保证运动精度,较高值赋予提示词描述的场景变化更多权重。
角色方向模式
视频方向跟随参考视频的面向方向——角色以与参考中人物相同的方式转身、旋转和面向。图像方向将角色锁定在上传图像的原始姿势方向,仅应用身体和肢体运动而不改变角色的面向。根据输出是否需要方向旋转来选择。
Kling AI 动作控制工作原理
上传角色图像和参考视频,三步生成运动迁移视频。
上传角色图像
上传角色、插画或主体的 JPG 或 PNG 图像——每边最小 300 像素,最大 10 MB,宽高比在 2:5 和 5:2 之间。全身清晰可见且遮挡最少的图像可产出最精确的骨骼映射。A-pose 或 T-pose 的源图像能为 AI 提供最清晰的关节参考点。
添加参考运动视频
上传展示要迁移动作的 MP4 或 MOV 视频——3 至 30 秒,最大 50 MB。单人素材、稳定镜头和连续动作可产出最高保真度的迁移。AI 从此视频中提取完整的骨骼运动序列并重定向到角色图像上。
生成运动视频
选择分辨率(720p 或 1080p),选择角色方向模式,添加可选文本提示词设定场景上下文,然后生成。处理时间取决于视频长度和分辨率,通常为 2 至 15 分钟。生成完成后下载运动迁移视频。
Kling 动作控制应用场景
AI 动作控制视频生成消除了对传统动作捕捉设备的需求。80% 的动画工作室现已在制作流程中使用 AI,生成式 AI 动画以 39.8% 的年复合增长率增长——受社交媒体、营销和娱乐领域对角色驱动内容的需求推动。
舞蹈视频创作
将编排动作复制到任意角色
录制或获取参考舞蹈视频,上传任意角色图像——插画、吉祥物、AI 生成肖像或产品标志——生成角色执行完全相同编排的视频。Kling 动作控制捕捉脚步、手臂位置、髋部旋转和节奏时序。AI 生成的舞蹈内容在短视频平台上的互动率比静态帖子高 50-300%。
AI 动态海报
以循环动作赋予静态作品生命力
将静态海报、专辑封面和宣传素材转换为带有微妙循环动作的 Kling AI 动态海报——呼吸、摆动、发丝飘动或环境氛围动态。运动迁移保留原始艺术风格和构图,同时添加能让观众在社交信息流和数字标牌显示屏上停留目光的动态元素。
角色动画
无需绑定即可制作动画
将人体动作迁移到插画角色、游戏精灵、产品吉祥物或 AI 生成的形象。动作控制 AI 完全跳过传统的绑定和关键帧流程——录制参考表演,直接应用到任意角色图像。使用 AI 工具的动画工作室报告制作成本降低高达 90%,时间线压缩高达 60%,相比手动角色动画。
产品演示
展示穿戴类和设备的运动效果
通过将人体运动迁移到穿着产品的角色来生成产品演示视频。展示服装垂坠和运动效果、配饰在动作序列中的表现,或带有逼真身体力学的运动装备操作——无需预约模特、摄影棚或每天花费数千美元的动作捕捉场次。
教学动作视频
精确演示动作技巧
为健身训练、瑜伽序列、武术套路、物理治疗练习或舞蹈教程创建教学内容。动作控制 AI 从参考演示中复制精确的关节角度、动作时序和身体定位,实现学习者可以逐步跟随的帧精确技巧可视化。
短视频社交内容
规模化生产热门动作内容
将热门舞蹈动作、反应手势或爆款运动序列应用到品牌角色上,发布到 TikTok、Reels 和 Shorts。87% 的内容创作者现已在创意工作流中使用 AI。动作控制让你以热点传播的速度生产角色驱动的动作内容——从单个参考视频在几分钟内生成多个角色变体。
动作控制 AI 使用指南
参考图指南
- Use clear, well-lit images with the full body visible and no cropped limbs
- Simple or solid backgrounds help the AI isolate the character skeleton
- A-pose or T-pose images provide the clearest joint mapping for most motion types
- Match the reference image body proportions to the reference video performer for highest fidelity
- 使用光线充足、全身清晰可见且肢体未被裁剪的图像
- 简洁或纯色背景有助于 AI 分离角色骨骼
- A-pose 或 T-pose 图像为大多数动作类型提供最清晰的关节映射
- 参考图的身体比例与参考视频表演者匹配可获得最高保真度
参考视频指南
- Use videos with continuous motion and a single performer — multi-person footage may cause skeleton confusion
- Stable camera with minimal cuts or scene changes produces the most consistent motion extraction
- Keep motion paths under 150 pixels per frame — extreme or rapid movements can cause artifacts
- Ensure the performer's full body stays in frame throughout the clip to avoid incomplete skeletal data
- 使用连续动作和单人表演者的视频——多人素材可能导致骨骼混淆
- 稳定镜头且无剪辑或场景切换可产出最一致的运动提取
- 保持每帧运动路径在 150 像素以内——极端或快速移动可能导致伪影
- 确保表演者全身在整个片段中始终保持在画面内,避免不完整的骨骼数据
技术规格
输入要求
- Reference image: JPG or PNG, minimum 300px per side, maximum 10 MB, aspect ratio 2:5 to 5:2
- Reference video: MP4 or MOV, 3-30 seconds, maximum 50 MB, single-person footage recommended
- Optional text prompt: up to 2,500 characters for scene context and style guidance
- Optional negative prompt: up to 2,500 characters to exclude unwanted elements
- 参考图:JPG 或 PNG,每边最小 300px,最大 10 MB,宽高比 2:5 至 5:2
- 参考视频:MP4 或 MOV,3-30 秒,最大 50 MB,建议单人素材
- 可选文本提示词:最多 2,500 字符,用于场景上下文和风格引导
- 可选反向提示词:最多 2,500 字符,用于排除不需要的元素
输出规格
- Resolution: 720p Standard or 1080p HD
- Duration: up to 10 seconds (image orientation) or 30 seconds (video orientation)
- Format: MP4 video output
- Processing time: 2-15 minutes depending on duration and resolution
- 分辨率:720p 标准或 1080p 高清
- 时长:最长 10 秒(图像方向)或 30 秒(视频方向)
- 格式:MP4 视频输出
- 处理时间:2-15 分钟,取决于时长和分辨率
相关 AI 视频工具
Kling 动作控制常见问题
关于 Kling 动作控制、AI 运动迁移和动作控制视频生成的技术解答。
开始创建动作控制视频
上传角色图像和参考运动视频,使用 Kling 动作控制生成帧精确的运动迁移。舞蹈编排、角色动画、动态海报和产品演示——无需绑定、无需动捕设备、无需动画技能。