搜索

+

104

-

回答

未来只会有一种多模态大模型，能文本、图片、声音、视频、3d文件输入，还是文本、图片、声音、视频、3d组合输出，只有一种api，阿里的太乱了，肯定会走向多模态精简。

网友回复

我知道答案，我要回答

我有问题

最新提问