乐鱼官网入口·尖端语音辨认专家Daniel Povey:新一代Kaldi可大幅下降收听语音词错误率 年末或将应用于一切小米AIoT产品
乐鱼·体育中国官方入口

手表

PRODUCTS

乐鱼官网入口·尖端语音辨认专家Daniel Povey:新一代Kaldi可大幅下降收听语音词错误率 年末或将应用于一切小米AIoT产品

2021-09-10 15:24:22 来源:乐鱼·体育中国官方入口 作者:乐鱼登录客户端 68
分享到:

  中国网科技8月31日讯 小米集团语音首席科学家、“Kaldi之父”Daniel Povey(丹尼尔·波维)今天承受媒体采访时称,新一代Kaldi方针不仅仅是赶上或许略微抢先这些语音辨认库,而是要根本地改动语音辨认的完结方法。

  Daniel Povey对中国网科技泄漏,现在小米AIoT产品中还用的是第一代Kaldi,接下来小米将逐渐把新一代Kaldi才能融入到小米产品中,估计在今年年末或明年初,开端将新一代Kaldi才能应用于小米产品,但现在仍在测验之中。

  谈及为何挑选在小米开发新一代Kaldi,Daniel Povey对记者直言:“现实上有许多大型互联网公司都想把我引起麾下,但小米是一家公司战略规划相对安稳的公司,加上表现出对开源项目的许诺与注重,因而在我需求做开源项目这一硬性规范看来,小米是最佳去向。”

  据悉,现有端到端语音辨认模型的盛行和准确率的逐渐提高,以及PyTorch、TensorFlow等深度学习东西包的遍及,是开发新一代Kaldi首要动力。相较初代而言,新一代Kaldi是一个全新代码库,需求彻底从头打造,由C++以及CUDA完结,并能够在Python调用。新一代Kaldi由3个独立的项目组成,别离称为 k2、Lhotse和Icefall。

  其间,最新算法Icefall是这次新一代Kaldi重要部分,根据完结“双向建模”和多层模型的优势,具有新一代Kaldi才能的AIoT产品能够大大提高语音辨认才能,然后下降收到语音指令的词错误率。小米集团方面称,现在已经在LibriSpeech数据集上取得了2.57%的词错误率,而且还在继续的进一步优化。

  Daniel Povey表明:“新一代Kaldi与PyTorch兼容,而且代码更简单修正,比初代Kaldi代码库更灵活得多,答应用户更轻松地测验新主意。而且止于现在,依托于Kaldi而发展起来的许多中小型企业有许多,Kaldi将一向坚持做项目开源。”

  揭露信息显现,Daniel Povey是语音辨认开源东西Kaldi的首要开发者和维护者,因而被称为“Kaldi之父”。而Kaldi东西简而言之的讲,现在国内三大语音帮手小爱同学、小度、天猫精灵运用的底层结构都是Kaldi,Kaldi等于是能让智能物联经过语音交互方法出现的根底,是现在被业界公认的语音辨认结构柱石。


乐鱼官网入口·尖端语音辨认专家Daniel Povey:新一代Kaldi可大幅下降收听语音词错误率 年末或将应用于一切小米AIoT产品 上一篇:构建下一代ASR:语音情感辨认运用程序 下一篇:新一代Kaldi将应用于小米多款产品 改动许多语音辨认方法