数字信号处理器 (DSP)

1.2 TI C674X DSP 语音信号处理方案及语音识别三要素

Loading the player...

现在介绍一下TI C674X语音信号处理前端这个是通过这框图我们可以看到C674X 是通过TI的麦克风正列麦克风正列进入TId ADC 然后把ADC通过FRS接口输入到C674X 然后通过FRS传给我们的RM 前端 RM再通过 Ylink chip WiFi 通过源传出到云端整个链路你看到基本上红色的这条线路是检测关键字我们一般称为KWS 蓝色的这一边一般是云分析命令以后反馈服务或者是反馈回你需要播放的内容语音信号前处理包括很多前处理的算法在这里简单给大家介绍一下像回声消除信号接入以后一般都会进入回声消除这跟你的麦克风的个数也有关比方说你要做4麦或者6.1环正或者是8.1 甚至双环正等等这些环正进入以后一般都是每个麦克风都要做一路AEC 做AEC以后像波速成型 bean forming 声源定位DOA 然后也要做降噪 dereverberation 也要做去混响最后要做AGC 这样处理以后基本上人是在 1米到10米之内你随便站在哪一个地方我们听到的声音是恒定不变的除了这些算法以后我们还会做一些只能待语音交互比方说大家可以看到很多语音合成刚才KWC已经介绍那么本地的语音识别 ASR 或者是声纹识别 SPR这个都是各个公司想要较劲的或者是核心技术所在我们现在介绍一下语音识别以及唤醒的性能语音识别方案的好坏其实有三大要素第一个是唤醒率第二个是误唤醒率第三个是识别率左边这个测试项目大家可以看一下它的参数是我们从TI的以下第三方拿到的数据也可以看到从误唤醒率现在是1-3 一次到两次每天其实亚马逊的测试标准是3次每天也就看到这个标准是低过亚马逊是低过亚马逊的测试标准符合亚马逊的要求看到其他一米或者三米的语音识别率都达到95% KWS 1米的唤醒率甚至高达99% 这个测试条件我相信大家它是有本地语音识别有50条内置磁条测试是采用第三方6+1的迈克阵列的环阵

现在介绍一下TI C674X语音信号处理前端

这个是通过这框图我们可以看到C674X

是通过TI的麦克风正列

麦克风正列进入TId ADC

然后把ADC通过FRS接口输入到C674X

然后通过FRS传给我们的RM

前端 RM再通过

Ylink chip WiFi 通过源传出到云端

整个链路你看到基本上红色的这条线路

是检测关键字

我们一般称为KWS

蓝色的这一边一般是云分析命令以后

反馈服务或者是反馈回你需要播放的内容

语音信号前处理包括

很多前处理的算法

在这里简单给大家介绍一下

像回声消除信号接入以后一般都会进入回声消除

这跟你的麦克风的个数也有关比方说

你要做4麦或者6.1环正

或者是8.1 甚至双环正

等等这些环正进入以后一般都是每个

麦克风都要做一路AEC

做AEC以后像波速成型

bean forming 声源定位DOA

然后也要做降噪 dereverberation

也要做去混响最后要做AGC

这样处理以后基本上人是在

1米到10米之内你随便

站在哪一个地方我们听到的声音是恒定不变的

除了这些算法以后我们还会

做一些只能待语音交互

比方说大家可以看到很多语音合成

刚才KWC已经介绍

那么本地的语音识别

ASR 或者是声纹识别

SPR这个都是各个公司想要较劲的

或者是核心技术所在

我们现在介绍一下语音识别以及唤醒的性能

语音识别方案的好坏其实有三大要素

第一个是唤醒率第二个是误唤醒率

第三个是识别率

左边这个测试项目大家可以看一下

它的参数是我们从TI的以下第三方

拿到的数据

也可以看到从误唤醒率

现在是1-3 一次到两次每天

其实亚马逊的测试标准是3次每天

也就看到这个标准是低过亚马逊

是低过亚马逊的测试标准

符合亚马逊的要求

看到其他一米

或者三米的语音识别率

都达到95%

KWS 1米的唤醒率甚至高达99%

这个测试条件我相信大家

它是有本地语音识别

有50条内置磁条

测试是采用第三方6+1的迈克阵列的环阵

视频报错

手机看

扫码用手机观看

收藏本课程

未学习 1.1 语音信号前处理的应用场景概述
00:03:27 播放
未学习 1.2 TI C674X DSP 语音信号处理方案及语音识别三要素
00:03:46 播放中

播放中
未学习 1.3 TI C5000、C6000 DSP 产品及语音识别参考设计概览
00:07:13 播放

视频简介