回答-BFW问答

在之前的v1/chat/completions基础上将模型改成gpt-4o-audio-preview，，然后增加 "modalities": ["text", "audio"], "audio": {"voice": "alloy","format": "wav"}参数即可，完整的curl代码如下

curl -X POST https://api.openai.com/v1/chat/completions \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
  "model": "gpt-4o-audio-preview",
  "modalities": ["text", "audio"],
  "audio": {
    "voice": "alloy",
    "format": "wav"
  },
  "messages": [
    {
      "role": "user",
      "content": "Recite a haiku about zeros and ones."
    }
  ]
}'

1返回的choice数据是base64编码的音频数据，解码后自己播放

回答

win10上powershell运行wsl报错Wsl/0x80072f7d如何解决？

人工智能技术属于科学范畴吗？

pi与claw及codex有啥不同？

有没有在电脑上运行iphone虚拟机的软件？

如何将电脑扬声器声音同步输出到另外一台手机或电脑上/

为啥图片和视频大模型的提示词支持json和python代码？

Chromium的 Kiosk 模式是干啥的？

豆包如何生成15秒以上的视频？

ai文本大模型最后会升级成做任何动画片吗？

python有没有一键扒谱和音乐背景旋律与人声分离的库？