音频
MiniMax Speech-02-hd 异步语音合成
POST
MiniMax Speech-02-hd 异步语音合成
该 API 支持基于文本到语音的异步生成,单次文本生成传输最大支持 100 万字符,生成的完整音频结果支持异步的方式进行检索。支持 100+系统音色、复刻音色自主选择;支持语调、语速、音量、比特率、采样率、输出格式自主调整。
提交长文本语音合成请求后,需要注意的是返回的 url 的有效期为自 url 返回开始的 24 个小时,请注意下载信息的时间。
适用于整本书籍等长文本的语音生成,任务排队耗时可能会较长。短句生成、语音聊天、在线社交等场景,建议使用 同步调用语音合成。
请求头
枚举值: application/json
Bearer 身份验证格式,例如:Bearer {{API 密钥}}。
请求体
待合成的文本,限制最长 5 万字符。
与 voice_id 二选一必填
增强对指定的小语种和方言的识别能力,设置后可以提升在指定小语种/方言场景下的语音表现。如果不明确小语种类型,则可以选择”auto”,模型将自主判断小语种类型。支持以下取值:
'Chinese', 'Chinese,Yue', 'English', 'Arabic', 'Russian', 'Spanish', 'French', 'Portuguese', 'German', 'Turkish', 'Dutch', 'Ukrainian', 'Vietnamese', 'Indonesian', 'Japanese', 'Italian', 'Korean', 'Thai', 'Polish', 'Romanian', 'Greek', 'Czech', 'Finnish', 'Hindi', 'auto'
响应参数
异步任务的 task_id。您应该使用该 task_id 请求 查询任务结果 API 以获取生成结果
示例
以下是如何使用 Minimax Speech-02-hd 异步请求 API 的示例。
- 通过向 Minimax Speech-02-hd API 发送 POST 请求来生成 task_id。
请求:
响应:
- 使用 task_id 获取输出视频。 2xx 范围内的 HTTP 状态码表示请求已成功接受,而 5xx 范围内的状态码表示内部服务器错误。 您可以在响应的 audios 字段中获取音频 audio_url。
响应:
音频文件:
MiniMax Speech-02-hd 异步语音合成