搜索

+

92

-

回答

阿里推出的图文音多模特向量大模型，可以对音频、视频、图片、文字生成embedding向量，进行语音理解，分类。

参考：https://help.aliyun.com/zh/dashscope/developer-reference/one-peace-multimodal-embedding-quick-start

网友回复

我知道答案，我要回答

我有问题

最新提问