手把手教你用 可灵AI 做 AI 数字人!
当前位置:点晴教程→知识管理交流
→『 技术文档交流 』
什么是数字人?怎么做数字人? 说白了,就是创建一个自己的克隆人,只需输入文案,就能生成自己说话的视频。 那今天,我将手把手教你使用数字人工具,让你无需露脸就能轻松做出自己的数字人。
打造数字人总共只需两步,接下来我将分步骤为大家拆解其底层逻辑。
第一步,要让数字人动起来;第二步,则是让数字人对口型。
对于第一步“动起来”,我们可以借助可灵 AI,因为它的动态生成效果既稳定又真实。
这里有三种实现方式:
第一种 使用可灵 AI 的文生视频功能。 可灵:https://klingai.kuaishou.com/
点击这个功能后,我们可以选择参考人脸。(这个功能只能铂金会员以上才行)
比如,我想使用自己的人脸,就直接选择“羊羊”,不过需要提前录制好自己的人脸素材。
在左上角的创意描述区域,使用“羊羊”的人脸,并进行详细描述,
像“我作为一个博主,眼神是怎样的,背景是什么样子,动作有哪些,整体画面风格如何”等。
描述完成后,填入不希望呈现的内容,如变形、扭曲、毁容等,
然后点击“立即生成”,
就能得到一个以我的人脸为主,动作稳定的视频。我们可以利用这个视频进行后期的对口型操作。
第二种 方法是采用图生视频的方式。
比如,我们先获取一张生成的图片,像我在这里截一张图,将其上传到这个位置后,在创意描述处输入我们期望图片会呈现怎样的动作。
这种图生视频方式的好处是什么呢?
一个是图片美观,背景也能随心设定,可控性很强,二是还能更精细地控制动作。
第三种 方式是自己拍摄。
自己拍一张照片,然后上传到可灵 AI 的图生视频中。
接着在图片创意描述处输入相关描述,比如让人物动起来,描述其眼神状态等。
不过建议大家尽量让动作缓慢些,人物动态效果不要太强烈。毕竟人正常面对镜头说话时,动作幅度不会特别大,而且动作幅度太大容易出现手指变形的 bug。
上传照片并完成描述后,点击“立即生成”,就能得到我们想要的视频。
这就是第一步,让数字人形象动起来。
接下来进入第二步——对口型。
对口型有两种方式, 第一种 是我们可以直接使用可灵 AI 的对口型功能。
点击“对口型”后,在左边上传视频,配音音频有文本驱动和声音驱动两种方式可选。
如果选择 文本驱动,还能挑选音色,输入想说的文本就能生成数字人讲解这段话的视频。
但不足之处在于,尽管音色选择多样,却无法使用自己的声音,难以达到与本人声音一模一样的效果。
不过对口型也有好处,我们可以选用他人音色,说不定会更加悦耳动听。
对口型还有 声音驱动 这种方式,我们能上传一段自己的音频,可灵 AI 支持 MP3 等常见音频格式。
上传音频后即可直接生成视频。
不过,可灵 AI 每次仅支持生成 5 秒的片段。
我们可以通过变速将音频尽量压缩至 5 秒以内,但这并长久之计,比较适合制作短口播视频、短数字视频,或者将多个片段组合起来使用。
第二种 方式,我们还可以使用 必火AI工具。 必火AI:https://www.bihuoai.com/login/7i1cN6
它的优势在于能够进行形象克隆和声音克隆,且生成效果较好。
下面来看看具体操作流程:
首先,上传视频以克隆数字分身,将前面可灵 AI 生成的动态视频上传;
接着,在声音克隆处克隆自己的声音;
最后,在数字分身板块进行创作,若采用文本驱动,输入想要数字人说的话,选择自己克隆好的声音,点击提交,就能生成一段数字人视频。
若采用音频驱动方式,上传自己的一段声音,同样可以生成数字人视频。
总体而言,最关键的就是这两步:
先生成一段动态视频,再让这段动态视频完成对口型操作,
这样一来,我们想要的数字人视频便制作完成了。 现在的 AI 时代,真的是减轻了人很多的工作量, 一天做 100条 口播的数字人时代真的来了。 阅读原文:原文链接 该文章在 2025/3/4 11:02:04 编辑过 |
关键字查询
相关文章
正在查询... |