搜索

+

94

-

有没有这样的端对端数字人ai大模型，输出是数字人说话的视频，输入是多模态信息？

人工智能音视频其他

有没有这样的端对端数字人ai大模型，输出是数字人说话的视频，输入是多模态信息？

就好像真正的人类一样。

网友回复

+

28

-

目前还没有，目前最强大的还是google的多模态大模型gemini，支持文字、图片、声音、视频、文档等不同类型...

点击查看剩余70%

我知道答案，我要回答

我有问题

最新提问