༺ཌༀQsjLuༀད༻语音转写-讯飞开放平台

大发pk10

新产品长处

准确率高,高效稳定
行业先进的语音识别技术,通用语音识别率98%(注:安徽电子产品监督检验所检测,报告编号151209010027)
个性热词,效果优化
无需算法开发,简单上传常用词句。优化识别效果,提高个性化准确率
格式转化,标点预测
对数字、日期、时间等返回格式化文本,根据对话语境,智能断句并匹配标点
方言语种,高效识别
支持除中英文外的多方言语种识别,适应复杂的语言环境

品牌成本

新用户礼包
个人开发者和企业开发者免费使用
时长
最高50小时
有效期
一年
方言/语种
中英文
套餐一
按时长套餐计费
时长
20小时
有效期
一年
方言/语种
中英文
套餐二
按时长套餐计费
时长
200小时
有效期
一年
方言/语种
中英文
套餐三
按时长套餐计费,赠送3个方言/语种
时长
1000小时
有效期
一年
方言/语种
额外赠送3个
套餐四
按时长套餐计费, 赠送5个方言/语种
时长
3000小时
有效期
一年
方言/语种
额外赠送5个
商务定制
有特殊环境或功能需求的客户
私有化部署
个性化功能
专属并发
定制方言/语种
大量采购
商务优惠

舒心系统提示:

1、 默认支持中文、英文、中英混合识别;购买套餐三可领取3个方言/语种,购买套餐四可领取5个方言/语种; 购买套餐后,可在领取所需方言/语种;购买多个套餐的情况下,赠送的方言/语种数量不叠加;

2、 后台登陆测量软件系统将选择选择情况发生,以秒为机构往前取整,采取选择量收取;

土话语种

土话
语种
民族风俗言语
语种价格购买
广东话
5000元2000零元
河南话
5000元2000元
西南官话(大发pk10贵川渝)
5000元2000元
语种价格购买
广东话
5000元2000零元
河南话
5000元20000
西南官话(大发pk10贵川渝)
5000元20000
语种价格购买
广东话
5000元2000零元
河南话
5000元20000
西南官话(大发pk10贵川渝)
5000元2000零元

和睦警告:

1、  快捷设置可以繁体英文版、英文字母、中英对照混合式识别图片;繁体英文版涵盖普通型话、哈尔滨话、四川话、东北亚话、四川话、安徽话、兰州话;

2、  江西话、山东话、江南官话需消费实用,中仅华东官话其中包含广西话、贵州省话、绵阳话、江苏话;

3、  购买时长套餐,可在领取方言/语种;藏语和维语不参与套餐赠送。

技艺规格

输入
接口输入规格
形式:
已录制音频
声道:
单声道&多声道
支持格式:
wav,flac,opus,m4a,mp3
采样率:
8KHz,16KHz
采样精度:
8bits,16bits
输出
接口输出规格
形式:
JSON格式字符串
编码:
UTF-8
结果:
分词形式&完整句子形式,词&句置信息度词&句时间戳,词属性,多候选词,文法格式智能转换,多发音人分离

注:

1、文法文件类型智能化转为具有电话电话、牌照、时候、时候甚至量词的归整,如“五个二十八”双引擎会正常识别归整为“5:30”。

2、词暴击伤害主要包括:常规词;口吻徘徊词,如“嗯”、“啊”、“呃”还有无寓意的从复词等;标点标志,如“,”等。

3、qq语音转写的辨别的一段文字毕竟为异步读取,最长5个小时以上读取。

4、语音转写引擎是适用于5小时以内的长音频识别,若您有大量1分钟以内的短音频需要识别,为了提高识别效率,建议使用语音听写服务。

5、使用本服务前请参阅实践指南,以获得更高的转写准确率。

开放者信息

WebAPI
可直接调用的WebAPI接口,具备流式传输能力,具备轻量、跨平台的特点
Java
Java平台智能语音SDK开发者资源,快速集成智能语音能力

视频播放教程下载

多见事情

1、 “发音转写 ”与 “发音听写 ”的辨别是?

品牌名称大全 适用的录音用时  使用的3d场景
话音听写 一点钟以里 组排沟通,如放入法、语音系统搜素
语音聊天转写 五天之内 更肯定地贴进生活的对战、演讲赛

 

2、 “已录影音视频文件转写”和“实时时间音视频文件运转写”的区别是?

已录制音频(recorded audio)转写:将预先录制完毕的完整音频文件传输至大发pk10端,转写服务处理完成后将输出此音频对应的完整文字结果。该流程为异步&非实时;

实时音频流(real-time streaming)转写:在采集音频的同时,连续上传音频流至大发pk10端,转写服务将实时返回文字结果,实现文字和声音的同步展现。

实时语音转写已上线,欢迎使用。

 

3、音频转写支撑怎样的表达?

答:默认支持中文、英文、中英混合识别;中文包括普通话、天津话、河北话、东北话、甘肃话、山东话、太原话;其他方言/语种需购买套餐或语种授权。目前可支持:

土话:杭州话、辽宁话、中南官话(广东话、兰州话、重庆市话、北京话)

语种:英文翻译版、英文翻译、日文、韩国语、俄语水平、俄语水平、泰国语、葡萄牙语

种族程序语言:藏语、维语

 

4、到目前为止话音转写的支持的音频论文格式为:

已录制音频(5小时内),wav,flac,opus,m4a,mp3,单声道&多声道;采样率:8KHz,16KHz

 

5、视频语音转写支不的支持潜在?

答:支持,要保证同一个appid每秒请求接口次数最大值在20次以下。

了解·推荐
售前在线咨询
加入官方社群
意见投诉
体验中心
new有奖调研
大发pk10 大发pk10