1. 接口说明
语音合成接口将文字信息转化为声音信息,同时提供了众多极具特色的发音人(音库)供您选择,可以在 在线体验发音人效果。该能力是通过HTTP API的方式给开发者提供一个通用的接口,适用于一次性交互数据传输的AI服务场景,即将文本一次性发送至云端,云端再将合成的音频数据返回给调用方。相较于SDK,API具有轻量、跨语言的特点,不过请注意该接口使用的HTTP API协议不支持跨域。
2. 接口Demo
示例demo请点击 这里 下载。目前仅提供部分开发语言的demo,其他语言请参照下方接口文档进行开发。也欢迎热心的开发者到 分享你们的demo。
3. 接口要求
集成语音合成API时,需按照以下要求。
4. 接口调用流程
采用通用的接口调用流程,详细请参照 接口描述 。
接口地址示例:
5. 接口请求参数
在 Http Request Header 中配置授权认证参数,见 。其中 X-Param 为各配置参数组成的 JSON 串经 BASE64 编码之后的字符串,原始 JSON 串各字段说明如下:
注: 在控制台添加服务后,点击“发音人管理”可自行添加并试用发音人,添加后会显示该发音人参数值,设置参数voice_name为相应的发音人参数值即可。另外,可以在 这里 在线体验发音人效果。
X-Param生成示例:
5.2. Body参数
6. 接口返回参数
需要根据 Content-type 的头部来确定是否服务端合成成功。
若合成成功,响应 header 包含:
Content-type: audio/mpeg
sid: hts0000bb3f@ch3d5c059d83b3477200
响应 body 为音频数据,可写入文件保存,保存类型由入参的 aue 决定:
- aue = lame, 音频文件保存类型为 mp3
若合成出现错误,响应 header 包含:
Content-type: text/plain
响应 body 为 json 字符串,json 字段如下:
其中 sid 字段主要用于 DEBUG 追查问题,如果出现问题,可以提供sid给讯飞技术人员帮助确认问题。
失败:
成功:
7. 调用示例
Copyright © iflytek.com 2018 all right reserved,powered by Gitbook该文件修订时间:2019-05-07 07:12:51