MiniMax Speech 2.8 HD 异步语音合成
音频
MiniMax Speech 2.8 HD 异步语音合成
POST
MiniMax Speech 2.8 HD 异步语音合成
MiniMax 异步语音合成 API,支持多种音色、情绪、语速等参数设置,文本长度限制最长 5 万字符,支持文件输入(最长 10 万字符)
请求头
枚举值:
application/jsonBearer 身份验证格式,例如:Bearer {{API 密钥}}。
请求体
待合成音频的文本,限制最长 5 万字符。和
• 语气词标签:仅当模型选择
text_file_id 二选一必填• 语气词标签:仅当模型选择
speech-2.8-hd 或 speech-2.8-turbo 时,支持在文本中插入语气词标签。支持的语气词:(laughs)(笑声)、(chuckle)(轻笑)、(coughs)(咳嗽)、(clear-throat)(清嗓子)、(groans)(呻吟)、(breath)(正常换气)、(pant)(喘气)、(inhale)(吸气)、(exhale)(呼气)、(gasps)(倒吸气)、(sniffs)(吸鼻子)、(sighs)(叹气)、(snorts)(喷鼻息)、(burps)(打嗝)、(lip-smacking)(咂嘴)、(humming)(哼唱)、(hissing)(嘶嘶声)、(emm)(嗯)、(whistles)(口哨)、(sneezes)(喷嚏)、(crying)(抽泣)、(applause)(鼓掌)待合成音频的文本文件 id,单个文件长度限制小于 10 万字符,支持的文件格式:txt、zip。和
• txt 文件:长度限制 <100000 字符。支持使用
• zip 文件:
• 压缩包内需包含同一格式的 txt 或 json 文件。
• json 文件格式:支持 [
text 二选一必填,传入后自动校验格式。• txt 文件:长度限制 <100000 字符。支持使用
<#x#> 标记自定义停顿。x 为停顿时长(单位:秒),范围 [0.01, 99.99],最多保留两位小数。注意停顿需设置在两个可以语音发音的文本之间,不可连续使用多个停顿标记• zip 文件:
• 压缩包内需包含同一格式的 txt 或 json 文件。
• json 文件格式:支持 [
title, content, extra] 三个字段,分别表示标题、正文、附加信息。若三个字段都存在,则产出 3 组结果,共 9 个文件,统一存放在一个文件夹中。若某字段不存在或内容为空,则该字段不会生成对应结果控制在合成音频的末尾添加音频节奏标识,默认值为 False。该参数仅对非流式合成生效
是否增强对指定的小语种和方言的识别能力。默认值为
null,可设置为 auto 让模型自主判断。可选值:Chinese, Chinese,Yue, English, Arabic, Russian, Spanish, French, Portuguese, German, Turkish, Dutch, Ukrainian, Vietnamese, Indonesian, Japanese, Italian, Korean, Thai, Polish, Romanian, Greek, Czech, Finnish, Hindi, Bulgarian, Danish, Hebrew, Malay, Persian, Slovak, Swedish, Croatian, Filipino, Hungarian, Norwegian, Slovenian, Catalan, Nynorsk, Tamil, Afrikaans, auto启用该参数,使得子句衔接处更自然,仅支持
speech-2.8-hd 和 speech-2.8-turbo 模型响应
任务创建成功后返回的对应音频文件的 ID。
• 当任务完成后,可通过 file_id 查询。 当请求出错时,不返回该字段注意:返回的下载 URL 自生成起 9 小时(32400 秒)内有效,过期后文件将失效,生成的信息便会丢失,请注意下载信息的时间
• 当任务完成后,可通过 file_id 查询。 当请求出错时,不返回该字段注意:返回的下载 URL 自生成起 9 小时(32400 秒)内有效,过期后文件将失效,生成的信息便会丢失,请注意下载信息的时间
异步任务的 task_id。您应该使用该 task_id 请求 查询任务结果 API 以获取生成结果
完成当前任务使用的密钥信息
计费字符数