乐鱼官网入口·对人工智能多点耐性 语音辨认获重大打破
乐鱼·体育中国官方入口

手表

PRODUCTS

乐鱼官网入口·对人工智能多点耐性 语音辨认获重大打破

2021-09-08 23:22:53 来源:乐鱼·体育中国官方入口 作者:乐鱼登录客户端 66
分享到:

  近来举办的我国人机语音交互范畴威望的学术会议——全国人机语音通讯学术会议(NCMMSC2015)上,百度泄漏其在汉语语音辨认方面取得重大打破。据悉,百度研制出了根据多层单向LSTM(长短时记忆模型)的汉语声韵母全体建模技能,并成功把衔接时序分类(CTC)练习技能嵌入到语音辨认传统技能建模结构中。该技能可以使机器的语音辨认相对错误率下降15%,使汉语安静环境一般线%,未来将大规模运用在百度语音查找等产品上。

  日前,百度语音技能部负责人贾磊媒体专访时称,语音辨认和大数据、机器学习、云核算等技能相得益彰,一同推动人工智能开展。

  他表明,机器本钱、高效核算等问题,是阻止语音辨认技能开展的几个重要因素。而百度研讨的CTC模型在解码部分的速度,比传统模型快5倍到10倍。合作专业的深度学习核算硬件,使后台耗费大大下降,有助于完结语音辨认技能的大规模遍及。

  百度方面泄漏,该技能立异是一项结构性的立异。这一打破也标志着,百度在世界范围内首要霸占了在汉语范畴运用CTC技能练习单向多层LSTM的高精度建模难题。

  据了解,2011年深度学习技能引进语音辨认范畴,推动整个工业界的人工智能技能运用进入深度学习年代。随后的几年里,CNN(卷积神经网络)、LSTM(长短时记忆模型)、CNN混合LSTM的建模技能在语音辨认工业产品中不断呈现,并持续提高语音辨认产品作用。

  眼下,百度把语音辨认的相对错误率下降15%,又会带来何种改动?对用户而言,是辨认率更准、辨认速度更快。对语音服务供给者来说,本钱会下降许多。

  “语音辨认正处于产业化迸发的边际,但机器核算本钱是一个很大的瓶颈。假如线%的查找都由语音完结,而核算本钱还和曩昔相同,那么没有公司能承当得起。”贾磊表明,语音服务要想大规模遍及,有必要下降后台服务器开支。

  他随即说,百度语音辨认研讨的CTC模型在解码部分的速度比传统模型快5倍到10倍。合作专业的深度学习核算硬件,当未来语音服务大规模遍及时,可以让后台核算本钱大大下降。对新技能的追逐,需求大数据、大渠道、极致核算等结合做支撑,因而百度这样的公司在未来有优势。

  媒体:已然将把此项技能用到百度语音查找产品上,对运用时刻表、运用前后的产品功用和用户体会不同等,能否讲讲?

  贾磊:我估计最早11月末、最迟12月末上线。由于咱们做的时分都是比着工业产品的体量去做的,包含模型体积、核算量、练习速度,悉数跟工业要求是共同的,所以可以很快运用到产品中去。

  用了之后,首要语音辨认会更准,其次由于它的核算量会很小,解码速度更快,后台本钱就会很低。这个模型对方言和口音的辨认作用都有必定的改进,并且对远场辨认也有必定改进。由于它是在一个建模单元的十几帧数据中提取出来一帧最实质最有代表性的特征来描绘这个建模单元,而这个实质特征的描绘不容易跟着时刻、地址而改动,所以对语音辨认的稳定性有很大的提高。

  贾磊:榜首,想处理口音、噪音的问题,练习数据还会持续加大,现在几万个小时练习数据是工业现状,我信任在不久的未来必定是十万小时。假如呈现这么大的核算量,对核算才能的需求会愈加激烈。所以大数据和高性能核算,是语音辨认开展到现在最显着和明晰的趋势。

  第二,是根据深度学习的个性化辨认。人的口音千差万别,不行能有一个语音辨认器辨认一切的声响,必定要完结个性化。而这种根据深度学习的个性化辨认,必定需求海量的存储空间和很大的数据吞吐传输才能,这个也只要具有大数据和云核算这种服务才能的公司可以供给。

  第三个职业趋势,语音辨认技能会和语意了解、交互技能等构成一整套语音的处理方案。由于人运用语音的意图不是把语音转成文字,而是运用语音去进行交互,并取得其所需的服务成果。这是未来的工业开展趋势,单纯的脱离了服务、脱离了渠道、脱离了核算才能去做语音技能的年代现已曩昔了。百度有场景、有内容、有需求,语音必定会做得越来越好。

  媒体:语音辨认技能要和其他技能,比方大数据、机器学习和云核算等一同运用,结合技能层面来讲,现在机遇是否老练?

  贾磊:这些技能是相得益彰的。作为人工智能学科的同业者,我的感觉是,短期去看人们倾向于高估技能的价值,从长时间去看人们倾向于轻视技能的价值。

  现在,人们或许倾向于觉得人工智能技能很牛,可以处理一切问题。可是短期内它没有处理,因而人就会发生一个心思,这个技能没用。可是,要对人工智能技能有决心,企业要勇于投入。当然,初期商业上必定会有一些丢失,或许短时刻里不会为公司带来商业价值;但久远来看,有助于研制新技能,并取得新的商业打破。(文/娜拉)

  如需转载请与《每日经济新闻》报社联络。未经《每日经济新闻》报社授权,禁止转载或镜像,违者必究。

  特别提示:假如咱们运用了您的图片,请作者与本站联络讨取稿费。如您不期望著作呈现在本站,可联络咱们要求撤下您的著作。


乐鱼官网入口·对人工智能多点耐性 语音辨认获重大打破 上一篇:百度语音辨认技能打破 巨子兴起 下一篇:NCMMSC2015:百度获得汉语语音辨认技能严重打破