+
92
-

回答

阿里推出的图文音多模特向量大模型,可以对音频、视频、图片、文字生成embedding向量,进行语音理解,分类。

参考:https://help.aliyun.com/zh/dashscope/developer-reference/one-peace-multimodal-embedding-quick-start

网友回复

我知道答案,我要回答