首页 > 应用与设计 > 个人电子产品 > TI 针对语音识别应用的嵌入式处理器解决方案 >

个人电子产品

最新课程

热门课程

1.2 TI C674X DSP 语音信号处理方案及语音识别三要素

现在介绍一下TI C674X语音信号处理前端 这个是通过这框图我们可以看到C674X 是通过TI的麦克风正列 麦克风正列进入TId ADC 然后把ADC通过FRS接口输入到C674X 然后通过FRS传给我们的RM 前端 RM再通过 Ylink chip WiFi 通过源传出到云端 整个链路你看到基本上红色的这条线路 是检测关键字 我们一般称为KWS 蓝色的这一边一般是云分析命令以后 反馈服务或者是反馈回你需要播放的内容 语音信号前处理包括 很多前处理的算法 在这里简单给大家介绍一下 像回声消除 信号接入以后一般都会进入回声消除 这跟你的麦克风的个数也有关 比方说 你要做4麦或者6.1环正 或者是8.1 甚至双环正 等等 这些环正进入以后 一般都是每个 麦克风都要做一路AEC 做AEC以后像波速成型 bean forming 声源定位DOA 然后也要做降噪 dereverberation 也要做去混响 最后要做AGC 这样处理以后 基本上人是在 1米到10米之内你随便 站在哪一个地方 我们听到的声音是恒定不变的 除了这些算法以后 我们还会 做一些只能待语音交互 比方说大家可以看到很多语音合成 刚才KWC已经介绍 那么本地的语音识别 ASR 或者是声纹识别 SPR这个都是各个公司想要较劲的 或者是核心技术所在 我们现在介绍一下语音识别以及唤醒的性能 语音识别方案的好坏其实有三大要素 第一个是唤醒率 第二个是误唤醒率 第三个是识别率 左边这个测试项目大家可以看一下 它的参数是我们从TI的以下第三方 拿到的数据 也可以看到 从误唤醒率 现在是1-3 一次到两次每天 其实亚马逊的测试标准是3次每天 也就看到这个标准是低过亚马逊 是低过亚马逊的测试标准 符合亚马逊的要求 看到其他一米 或者三米的语音识别率 都达到95% KWS 1米的唤醒率甚至高达99% 这个测试条件我相信大家 它是有本地语音识别 有50条内置磁条 测试是采用第三方6+1的迈克阵列的环阵

现在介绍一下TI C674X语音信号处理前端

这个是通过这框图我们可以看到C674X

是通过TI的麦克风正列

麦克风正列进入TId ADC

然后把ADC通过FRS接口输入到C674X

然后通过FRS传给我们的RM

前端 RM再通过

Ylink chip WiFi 通过源传出到云端

整个链路你看到基本上红色的这条线路

是检测关键字

我们一般称为KWS

蓝色的这一边一般是云分析命令以后

反馈服务或者是反馈回你需要播放的内容

语音信号前处理包括

很多前处理的算法

在这里简单给大家介绍一下

像回声消除 信号接入以后一般都会进入回声消除

这跟你的麦克风的个数也有关 比方说

你要做4麦或者6.1环正

或者是8.1 甚至双环正

等等 这些环正进入以后 一般都是每个

麦克风都要做一路AEC

做AEC以后像波速成型

bean forming 声源定位DOA

然后也要做降噪 dereverberation

也要做去混响 最后要做AGC

这样处理以后 基本上人是在

1米到10米之内你随便

站在哪一个地方 我们听到的声音是恒定不变的

除了这些算法以后 我们还会

做一些只能待语音交互

比方说大家可以看到很多语音合成

刚才KWC已经介绍

那么本地的语音识别

ASR 或者是声纹识别

SPR这个都是各个公司想要较劲的

或者是核心技术所在

我们现在介绍一下语音识别以及唤醒的性能

语音识别方案的好坏其实有三大要素

第一个是唤醒率 第二个是误唤醒率

第三个是识别率

左边这个测试项目大家可以看一下

它的参数是我们从TI的以下第三方

拿到的数据

也可以看到 从误唤醒率

现在是1-3 一次到两次每天

其实亚马逊的测试标准是3次每天

也就看到这个标准是低过亚马逊

是低过亚马逊的测试标准

符合亚马逊的要求

看到其他一米

或者三米的语音识别率

都达到95%

KWS 1米的唤醒率甚至高达99%

这个测试条件我相信大家

它是有本地语音识别

有50条内置磁条

测试是采用第三方6+1的迈克阵列的环阵

视频报错
手机看
扫码用手机观看
收藏本课程

相关下载

视频简介

1.2 TI C674X DSP 语音信号处理方案及语音识别三要素

所属课程:TI 针对语音识别应用的嵌入式处理器解决方案 发布时间:2017.08.24 视频集数:3 本节视频时长:3:46
已有2人参与了讨论去论坛跟帖交流
new
关闭广告