|  客服中心  |  合作联系
搜刊网
学术热点
行业资讯
声学所在线端对端语音识别研究获进展
发布时间:2020-08-14 来源:声学研究所 访问:

  端对端语音识别是一种利用深度学习模型将语音信号直接转变为文字的技术,其中,基于注意力机制的模型可以达到较高的识别准确率。但大多数注意力机制模型需要完整的语音信号,不适用于在线处理语音流。

  针对在线语音识别的应用场景,中国科学院声学研究所语言声学与内容理解重点实验室博士生缪浩然与其导师、研究员张鹏远,助理研究员程高峰等对主流注意力机制处理语音流的性能开展研究,提出一种单调截断语音流的在线注意力机制和一套高效实时的解码算法。近日,相关研究成果在线发表在IEEE/ACM Transactions on Audio, Speech, and Language Processing上。 

  研究发现,语音识别系统对各时刻语音信号注意力的权重分布呈指数衰减态势,这不利于处理长时语音流;在线注意力模型训练和推理之间存在差异,导致模型性能下降。基于上述问题,研究人员在设计单调截断语音流的在线注意力模型时,优化注意力权重指数衰减特性、通过离散化注意力权重缩小训练和推理之间的差异。

  基于公开的中英文语音识别数据集的实验表明,单调截断语音流的在线注意力模型在处理长时语音流时性能更稳定;基于注意力机制和联结主义时序分类准则的联合在线解码算法,在线语音识别系统的字错误率略高于离线系统,其解码速度可以达到离线系统的1.5倍。这种单调截断语音流的在线注意力机制和相关解码算法为端对端语音识别技术在大规模工业在线产品中的应用提供可行方案。

  该研究得到国家自然科学基金的资助。

在线端对端语音识别框架(图/中科院声学所)

相关文章
热门资讯
摘要:9月28日-29日,《两岸关系》杂志社社长任勉一行3人来漯河临颍就陈星聚杯太极拳比赛筹备工作情况进行调...
精品推荐
摘要:摘 要:健康的心理素质是健康人的必备素质。在学科教学中进行心理健康的教育,是心理健康教育的重要途径...
热门期刊
少年儿童研究少年儿童研究
《少年儿童研究》(半月刊)创刊于1988年,是由中国青少年研究中心;中国少年先锋队工作学会;中国青年政治学院主办...
石油和化工节能石油和化工节能
《石油和化工节能》是中国化工节能技术协会会刊。 《石油和化工节能》本刊以节能为宗旨,面向石油和化学工业...
自然博物自然博物
《自然博物》创刊于2014年,由浙江自然博物馆主办,以马列主义、毛泽东思想、邓小平理论和“三个代表”重要思...
徐州师范大学学报(教育科学版)徐州师范大学学报(教育科学版)
《徐州师范大学学报:教育科学版》是徐州师范大学主办的教育科学学术期刊。本刊以推动教育研究、服务教育事...
西南大学学报西南大学学报
《西南大学学报(社会科学版)》办刊宗旨:坚持以邓小平理论和“三个代表”重要思想为指导,用科学发展观统揽学...
高教研究与实践高教研究与实践
《高教研究与实践》1982年创刊(曾名《教学研究》、《高教研究》),内刊,季刊。 《高教研究与实践》创刊20余年来...

友情链接
中教杯 国家新闻出版总署 中国知网 万方数据 维普网 中国科学院 中国国家图书馆 央视英文版 中国留学网 中青网 中国国家人才网 中国经济网 中国日报网 中国新闻网 中国学术期刊网
关于我们
平台简介
诚聘英才
企业文化
竞争优势
版权信息
服务条款
客服承诺
常见问题
版权声明
合作加盟
期刊加盟
广告服务
联系我们
网站导航
期刊大全
论文下载
课题申报
学术会议
编辑QQ
编辑联络
2007-2023
中文学术期刊检索机构
bianjibu777@qq.com
联系我们

版权所有©2007- 2023 中国学术期刊网(qikanw.com) All Rights Reserved 京ICP备2021008252号
本站是学术论文网络平台,若期刊网有侵犯您的版权,请及时与期刊网客服取得联系,联系信箱: bianjibu777@qq.com    
中国学术期刊网