+
74
-

回答

未来只会有一种多模态大模型,能文本、图片、声音、视频、3d文件输入,还是文本、图片、声音、视频、3d组合输出,只有一种api,阿里的太乱了,肯定会走向多模态精简。

网友回复

我知道答案,我要回答