+
94
-

有没有这样的端对端数字人ai大模型,输出是数字人说话的视频,输入是多模态信息?

有没有这样的端对端数字人ai大模型,输出是数字人说话的视频,输入是多模态信息?

就好像真正的人类一样。


网友回复

+
28
-

目前还没有,目前最强大的还是google的多模态大模型gemini,支持文字、图片、声音、视频、文档等不同类型...

点击查看剩余70%

我知道答案,我要回答