什么是词错率(WER)呢?词错率就是指将一个词语从语音转录成为文字时的错误几率。据外媒报道,日前谷歌高级研究员杰夫·迪恩(Jeff Dean)在人工智能前沿峰会(AI Frontiers)上声称,谷歌已经将语音识别的词错率降低了30%以上!谷歌发言人随后证明了这一数据。
谷歌语音助手
迪恩称,词错率的下降得益于神经网络的使用,后者是谷歌和其他公司在深度学习中使用的一种系统。研究人员使用大量数据对神经网络进行训练,例如语音片段,然后让他们对新数据作出推断。谷歌在2012年首次将神经网络用于语音识别中,当时正值“果冻豆”Android系统发布。
谷歌并不是经常讨论公司在语音识别技术上取得的进展,该技术影响着越来越多的谷歌产品,从Google Home智能音箱到Gboard输入法。但是在2015年,谷歌CEO桑德加·皮查伊(Sundar Pichai)曾表示,谷歌的语音识别词错率为8%。
除了谷歌之外,苹果和微软也在降低语音识别词错率上有着不小的成绩!在2016年8月份苹果Siri资深总监亚历克斯·阿赛洛(Alex Acero)声称,Siri在所有语言中的错误率降低了两倍,很多情况下甚至超过了两倍;而微软则在2016年9月份表示其研究人员已经将词错率降至6.3%。
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。
本文地址:/google/2021-03-07/11298.html