公司新闻
您现在的位置:首页 >> 公司新闻
人工神经网络带来语音识别新突破 准确率提升33%
作者:admin  发布日期:2013.05.04
【导读】日前,微软在博客上宣布Microsoft在语音识别领域获重大突破。通过采用深度人工神经网络技术,微软大大提升了语音识别的准确率,错误率降低至18.5%,准确率比传统技术提升了33%。这让流利的语音对语音程序变得更加现实。

2011年8月29日第12届国际语音通信协会年会(12th annual Conference of the International Speech Communication Association)上,微软研究人员Dong Yu和Frank Seide发布论文,宣布微软在深度神经网络(deep neural network)上取得突破,使其在性能上能赶上目前最先进的语音识别技术

现有的语音识别技术都需要先训练软件,了解用户的语言模式。而语音识别技术的终极目标是提供即时使用、无特定说话者的自动识别服务——不需要训练、 适用于所有人和不限条件。

研究人员指出,语音识别对于移动日益重要,因为声音是智能手机的一种基本接口模式。利用人工神经网络(ANN)来提高语音识别性能的概念最早在80年代提出,人工神经网络和隐马尔可夫模型(HMM)使大词汇语音识别技术前景大好。但由于针对性的“培训”可以提高模型精确度,传统的高斯混合模型(GMM-HMMS)就在大词汇语音识别上比人工神经网络表现得更好,人工神经网络进行语音识别的技术就没有进行商业应用。

为了进一步加强该技术的实际应用,研究人员建立了有超过660万个神经联系的巨大的人工神经网络,是语音识别技术中所应用过的最大的网络。该技术无需用户对识别系统进行“训练”,而是通过“即时、因人而异的自动语音识别”技术实现。换言之,这是真正的人声识别。随后的实验表明错误率为18.5%,比最先进的常规系统相对提高33%。

目前该研究仍是一个科研项目,但微软表示该项技术的突破大大提升了语音识别技术商业化的潜力——它“将改变我们的工作和生活。试想它的这些应用:实时的自然口译、流畅的谈话、音频检索甚至用自然语言与计算机对话。”

关闭 | 浏览( ) |
更多
联系我们 | 网站地图
COPYRIGHT © 2013-2015 创微芯电子科技 ALL RIGHT RESERVED.
技术支持:宇蓝网络    后台管理   访问次数:[]