Day1/5：SkyReels-A3——形随声动，让数字人“说话”的魔法

8月11日，昆仑万维正式发布SkyReels-A3模型，基于“DiT（Diffusion Transformer）视频扩散模型+插帧模型进行视频延展+基于强化学习的动作优化+运镜可控”，其能实现任意时长的全模态音频驱动数字人创作。

当前SkyReels-A3模型已上线，欢迎登录SkyReels官网体验：

地址

SkyReels-A3项目主页：

https://skyworkai.github.io/skyreels-a3.github.io/

SkyReels 官网地址（登录后在左侧导航栏中选择Talking Avatar工具）：

https://www.skyreels.ai/home

SkyReels系列开源模型地址：

https://huggingface.co/Skywork

作为音频驱动（audio-driven）人像视频生成模型，SkyReels-A3就像给任意照片或视频装上“AI声带”：

SkyReels-A3

SkyReels-A3模型在以下四个方向上为用户带来新体验：

例如我们输入以下图片、音频和prompt，等待几秒之后，SkyReels-A3即可生成口型、表情、动作都自然同步的视频。