语音识别引擎
客知音自主研发,支持私有化部署!
产品简介
客知音拥有自主知识产权的语音识别(ASR)引擎,除了让机器能“听到”声音,与国际接轨的自然语言处理(NLP)技术更能让机器“听懂”人类的语言。客知音语言识别引擎应用语音识别与语言理解核心技术,自动从海量录音中提取包括文本、因素在内的各种信息,利用搜索及索引技术进行关键词检索、筛选、分类、聚类等,大幅度提升工作效率,挖掘分析价值信息。
功能模块
实时转换
自动将连续语音的内容转成文字,支持在线语音流实时识别或离线语音数据识别
话者分离
自动分离不同说话人的语音,方便对不同角色分别进行分析
时间索引
识别结果除了文字外,还可同时给出时间索引,信息方便后期自定义信息检索
多路并行
引擎支持多进程并发,支持针对海量数据的并行处理
标准接口
引擎支持标准 RestfulAPI / Websocket / MRCP 等各种网络协议,同时也提供Python和C的SDK
灵活开发
通过提供方便灵活的开发接口,多项参数可调,使用户可以方便灵活地进行应用开发
产品优势
识别准确率高
TDNN,Chain,ResNet等深度神经网络(DNN)声学建模技术;大量实际电话语音的训练数据,可适应各种压缩格式的通话录音及不同呼叫中心信道所带来的噪声,适配呼叫中心场景用户口语发生特点;积累大量各行业的文本语料,可在领域内进行优化
持续优化
客知音持续跟踪业界在语音识别领域的最新进展,保持模型算法的更新,无论是云端还是私有化部署客户,都能及时享受到最新语音识别技术所带来的红利
语音识别引擎准确率高
对于呼叫中心、电话对话类型语音,识别准确率为80%,经过模型优化训练以后能够达到85%以上
高效部署
引擎使用docker进行封装,避免繁琐的依赖安装,10分钟即可完成引擎部署上线,稳定性高
利用AI技术赋能客服与销售,提高客户满意度,提升销售业绩!