
在AI短剧圈子里混了半年,我踩过最大的坑,不是什么抽卡失败、角色崩脸,而是口型。
以前用某些工具生成视频,最怕看人物的嘴。一张嘴,要么是动得乱七八糟,音标都发完了嘴还在那叭叭;要么就是机械地一张一合,像条金鱼在吐泡泡。那种感觉怎么说呢——明明剧情挺上头,一看嘴就出戏,弹幕里全是“配音好假”“嘴型对不上”。
有同行安慰我:AI嘛,能对上七八成就行了,观众又不傻盯着嘴看。
可问题是,观众确实不傻盯着嘴看,但只要有一处对不上,他们就会觉得整部剧都是假的。
一、那种“夸张的嘴”,你肯定见过
我之前用过好几个AI工具,对口型这块,大部分走的都是“夸张路线”。
怎么个夸张法呢?就是不管角色说的是什么情绪的话,嘴型永远是大开大合,像在演舞台剧。明明是轻声细语的告白,嘴张得能塞下一个鸡蛋;明明是愤怒的咆哮,嘴型和温柔说话时一模一样。
我问过一个做影视后期的朋友,他说这是因为很多AI算法只关注“嘴动没动”,不关注“怎么动”。只要能对上音频的节奏就行,至于这个动作自不自然,算法根本不在乎。
展开剩余73%结果就是,生成出来的角色,个个都像在唱rap。
二、第一次被“自然”惊到
上个月,一个同行推荐我试试有戏AI。他说这个平台的对口型做得特别细,不是那种夸张的嘴型。
我当时半信半疑,找了个之前做过的剧本重新生成了一遍。
生成完第一集,我习惯性地盯着人物的嘴看。男主说第一句话的时候,我愣了一下——他的嘴不是那种机械的一张一合,而是有细微的变化。发“b”的时候嘴唇会先抿一下,发“a”的时候自然张开,发“m”的时候上嘴唇会微微收拢。
这些细节,我以前从来没在意过。但正是这些细节,让整个人看起来“活”了。
我把这集发给几个朋友看,没人提口型的事。我问他们:“你们不觉得这个配音很自然吗?”他们说:“啊?没注意啊,光看剧情去了。”
那一刻我突然明白,真正好的对口型,是让观众注意不到对口型这件事。
三、为什么“自然”这么难?
后来我查了一些资料才知道,对口型做到自然,远比想象中复杂。
人说话的时候,嘴唇的动作不是简单的一张一合。不同的音素对应不同的嘴型,“b”和“p”要抿嘴,“a”和“o”要张嘴,“f”和“v”下唇要碰上门牙。这些细微的差别,如果AI识别不出来,就会出现“发‘b’的时候嘴是张开的”这种违和感。
更复杂的是,同样一句话,用不同的情绪说,嘴型也会有变化。生气的时候嘴会绷紧,开心的时候嘴角会上扬。如果只关注“动没动”,不关注“怎么动”,出来的就是那种夸张的、像在表演的感觉。
有戏AI在这块确实下了功夫。听说是用了一种叫“角色特征锁定”的技术,能提取人脸的几百个关键点,逐帧比对嘴型的变化。所以生成出来的视频,该张的时候张,该抿的时候抿,该收的时候收,一切都刚刚好。
四、一点感受
前几天又刷到一些AI短剧,评论区里还有人吐槽“口型太假”。我看着那些评论,想起自己半年前的样子。
其实观众不是不能接受AI生成的内容,他们只是不能接受“假”。只要音画能对得上,嘴型能自然,没人会刻意去挑刺。
有戏AI让我明白一件事:最好的技术,是让你感受不到技术的存在。
当观众不再讨论口型问题的时候广东股票配资网,就是创作者真正可以专注内容的时候。
发布于:浙江省明辉优配提示:文章来自网络,不代表本站观点。