语音转写(Long Form ASR)基于深度全序列卷积神经网络,将长段音频(5小时以内)数据转换成文本数据,为信息处理和数据挖掘提供基础。
转写的是已录制音频(非实时),音频文件上传成功后进入等待队列,待转写成功后用户即可获取结果,返回结果时间受音频时长以及排队任务量的影响。 如遇转写耗时比平时延长,大概率表示当前时间段出现转写高峰,请耐心等待即可,我们承诺有效任务耗时最大不超过5小时,详情请参考SLA协议 。
另外,为使转写服务更加通畅,请尽量转写5分钟以上的音频文件,上传大量的短音频易引起网络和服务器资源紧张,从而导致任务排队积压。
音频时长与理论返回时间可以参考下表(请注意,实际返回时长受上传的音频时长和任务总量影响,忙时会出现任务排队情况):
| 音频时长X(分钟) | 参考返回时间Y(分钟) |
|---|---|
| X<10 | Y<3 |
| 10<=X<30 | 3<=Y<6 |
| 30<=X<60 | 6<=Y<10 |
| 60<=X | 10<=Y<20 |
| 内容 | 说明 |
|---|---|
| 请求协议 | http[s](为提高安全性,强烈推荐https) |
| 请求地址 | 1、文件上传:http[s]: //raasr.xfyun.cn/v2/api/upload 2、获取结果:http[s]: //raasr.xfyun.cn/v2/api/getResult 注:服务器IP不固定,为保证您的接口稳定,请勿通过指定IP的方式调用接口,使用域名方式调用 |
| 请求方式 | POST |
| 接口鉴权 | 签名机制,详见下方signa生成 |
| 字符编码 | UTF-8 |
| 响应格式 | 统一采用JSON格式 |
| 开发语言 | 任意,只要可以向讯飞云服务发起HTTP请求的均可 |
| 音频属性 | 采样率16k或8k、位长8bit或16bit、单声道&多声道 |
| 音频格式 | mp3,wav,pcm,aac,opus,flac,ogg,m4a,amr,speex(微信),lyb,ac3,aac,ape,m4r,mp4,acc,wma |
| 音频大小 | 不超过500M |
| 音频时长 | 不超过5小时,建议5分钟以上 |
| 语言种类 | 中文普通话、英文,小语种以及中文方言可以到控制台-语音转写-方言/语种处添加试用或购买 |
| 转写结果保存时长 | 已完成订单(包含成功和失败)会在识别完成 72 小时后删除,即无法再被查到结果 |
| 获取结果次数 | 不得超过100次 |
| SLA保障时长 | 返回时长最大不超过5小时,赔偿标准等详情请参考SLA协议 |
| 语种名称 | 语种编码 |
|---|---|
| 中文 | cn |
| 英文 | en |
| 日语 | ja |
| 韩语 | ko |
| 俄语 | ru |
| 法语 | fr |
| 西班牙语 | es |
| 越南语 | vi |
| 粤语 | cn_cantonese |
| 维吾尔语 | cn_uyghur |
| 藏语 | cn_tibetan |
| 阿拉伯语 | ar |
| 德语 | de |
| 意大利语 | it |
| 错误码 | 描述 |
|---|---|
| 100001 | 订单不存在或状态异常 |
| 100002 | 订单音频未上传 |
| 100003 | 参数错误 |
| 100004 | 查询订单错误 |
| 100005 | 查询音频为空 |
| 100006 | 上传音频异常 |
| 100007 | 权限错误 |
| 100008 | 签名异常-请求时间超过限制 |
| 100009 | 签名校验不通过 |
| 100012 | 请求超过频率限制 |
| 100013 | 订单未完成 |
| 100015 | 热词必须是中文 |
| 100016 | 热词超出长度限制 |
| 100017 | 热词超出数量限制 |
| 100018 | 热词分隔符不能连续出现 |
| 100019 | 热词验证失败 |
| 100020 | 语言验证失败 |
| 100021 | 热词上传失败 |
| 100022 | 热词不断重复 |
| 100023 | 热词保存失败 |
| 100024 | 热词为空 |
| 100025 | 热词 ID 未知 |
| 100026 | 时间格式必须为:yy-MM-dd |
| 100027 | patch ID 未知 |
| 100028 | Patch 验证失败 |
| 100029 | 文件已存在 |
| 100030 | 未知的文件格式 |
| 100031 | 多候选 ID 未知 |
| 100032 | 多候选验证失败 |
| 100033 | 无效的角色分离个数,角色分离个数范围:[0-10] |
| 100034 | 更改 AccesskeySecret 失败 |
| 100037 | 非法的订单号 |
| 100038 | 删除订单验证失败 |
| 100039 | 订单为空 |
| 100040 | 订单个数超出限制 |
| 100042 | 外链地址无效 |
| 100041 | 切换通道失败 |
| 100043 | 通道类型验证失败 |
| 100044 | 通道类型不存在 |
有奖调研 诚邀您参与我们转写服务有奖调研,参与问卷即有机会获取超长服务包
答:目前语音转写支持的音频格式为:已录制音频(5小时内),wav,flac,opus,m4a,mp3,单声道&多声道,支持语种:中文普通话、英语、开通的小语种以及中文方言,采样率:8KHz,16KHz
答:支持,要保证同一个appid每秒请求接口次数最大值在20次以下。
答:可以领取新用户礼包,根据您认证的程度,提供最多50小时的免费时长,有效期为一年。
答:支持语种:中文普通话、英语,小语种以及中文方言可以到控制台-语音转写-方言/语种处添加试用或购买;设置方式参考上述语言参数切换即可
答:扣量优先级:免费试用>批量购买,即在“批量购买”的套餐额度剩余的情况下,又领取了免费试用的体验包,则领取的免费试用体验包立即生效,并被设定为当前扣量套餐。而之前购买的套餐包的额度和到期日不变。