搜索

有没有ai实现数字人视频实时通话聊天的端对端大模型？

音视频人工智能元宇宙

自定义ai对象为一个人的照片，然后照片在ai的驱动下动起来，能说话，有表情、动作、还能实时与你视频聊天，能看的到你的视频影像，就像与远处的好友视频通话一样，有没有这样的技术实现，我想做一款ai数字人视频通话app，就是缺少一个这样的api调用，目前语音实时通话音色太少了，还不能自定义。

网友回复

硅基智能的DUIX ONE可能是你要找的。

800_auto

硅基智能的DUIX ONE是一款新一代的多模态大模型，它具备以下几个核心特点：

多模态交互体验：DUIX ONE结合了视觉、听觉与情绪感知，提供了全面的多模态交互体验。这意味着它不仅能够进行语音交互，还能通过视觉识别和情绪感知来理解和响应用户的需求。

沉浸式人机交互：DUIX ONE实现了沉浸式的人机交互，使得硅基生命以可视化的形式出现在工作和生活中，类似于电影《Her》中的场...

点击查看剩余70%

我知道答案，我要回答

我有问题