1.2 TI C674X DSP 语音信号处理方案及语音识别三要素
Loading the player...
将在30s后自动为您播放下一课程
现在介绍一下TI C674X语音信号处理前端 这个是通过这框图我们可以看到C674X 是通过TI的麦克风正列 麦克风正列进入TId ADC 然后把ADC通过FRS接口输入到C674X 然后通过FRS传给我们的RM 前端 RM再通过 Ylink chip WiFi 通过源传出到云端 整个链路你看到基本上红色的这条线路 是检测关键字 我们一般称为KWS 蓝色的这一边一般是云分析命令以后 反馈服务或者是反馈回你需要播放的内容 语音信号前处理包括 很多前处理的算法 在这里简单给大家介绍一下 像回声消除 信号接入以后一般都会进入回声消除 这跟你的麦克风的个数也有关 比方说 你要做4麦或者6.1环正 或者是8.1 甚至双环正 等等 这些环正进入以后 一般都是每个 麦克风都要做一路AEC 做AEC以后像波速成型 bean forming 声源定位DOA 然后也要做降噪 dereverberation 也要做去混响 最后要做AGC 这样处理以后 基本上人是在 1米到10米之内你随便 站在哪一个地方 我们听到的声音是恒定不变的 除了这些算法以后 我们还会 做一些只能待语音交互 比方说大家可以看到很多语音合成 刚才KWC已经介绍 那么本地的语音识别 ASR 或者是声纹识别 SPR这个都是各个公司想要较劲的 或者是核心技术所在 我们现在介绍一下语音识别以及唤醒的性能 语音识别方案的好坏其实有三大要素 第一个是唤醒率 第二个是误唤醒率 第三个是识别率 左边这个测试项目大家可以看一下 它的参数是我们从TI的以下第三方 拿到的数据 也可以看到 从误唤醒率 现在是1-3 一次到两次每天 其实亚马逊的测试标准是3次每天 也就看到这个标准是低过亚马逊 是低过亚马逊的测试标准 符合亚马逊的要求 看到其他一米 或者三米的语音识别率 都达到95% KWS 1米的唤醒率甚至高达99% 这个测试条件我相信大家 它是有本地语音识别 有50条内置磁条 测试是采用第三方6+1的迈克阵列的环阵
现在介绍一下TI C674X语音信号处理前端 这个是通过这框图我们可以看到C674X 是通过TI的麦克风正列 麦克风正列进入TId ADC 然后把ADC通过FRS接口输入到C674X 然后通过FRS传给我们的RM 前端 RM再通过 Ylink chip WiFi 通过源传出到云端 整个链路你看到基本上红色的这条线路 是检测关键字 我们一般称为KWS 蓝色的这一边一般是云分析命令以后 反馈服务或者是反馈回你需要播放的内容 语音信号前处理包括 很多前处理的算法 在这里简单给大家介绍一下 像回声消除 信号接入以后一般都会进入回声消除 这跟你的麦克风的个数也有关 比方说 你要做4麦或者6.1环正 或者是8.1 甚至双环正 等等 这些环正进入以后 一般都是每个 麦克风都要做一路AEC 做AEC以后像波速成型 bean forming 声源定位DOA 然后也要做降噪 dereverberation 也要做去混响 最后要做AGC 这样处理以后 基本上人是在 1米到10米之内你随便 站在哪一个地方 我们听到的声音是恒定不变的 除了这些算法以后 我们还会 做一些只能待语音交互 比方说大家可以看到很多语音合成 刚才KWC已经介绍 那么本地的语音识别 ASR 或者是声纹识别 SPR这个都是各个公司想要较劲的 或者是核心技术所在 我们现在介绍一下语音识别以及唤醒的性能 语音识别方案的好坏其实有三大要素 第一个是唤醒率 第二个是误唤醒率 第三个是识别率 左边这个测试项目大家可以看一下 它的参数是我们从TI的以下第三方 拿到的数据 也可以看到 从误唤醒率 现在是1-3 一次到两次每天 其实亚马逊的测试标准是3次每天 也就看到这个标准是低过亚马逊 是低过亚马逊的测试标准 符合亚马逊的要求 看到其他一米 或者三米的语音识别率 都达到95% KWS 1米的唤醒率甚至高达99% 这个测试条件我相信大家 它是有本地语音识别 有50条内置磁条 测试是采用第三方6+1的迈克阵列的环阵
现在介绍一下TI C674X语音信号处理前端
这个是通过这框图我们可以看到C674X
是通过TI的麦克风正列
麦克风正列进入TId ADC
然后把ADC通过FRS接口输入到C674X
然后通过FRS传给我们的RM
前端 RM再通过
Ylink chip WiFi 通过源传出到云端
整个链路你看到基本上红色的这条线路
是检测关键字
我们一般称为KWS
蓝色的这一边一般是云分析命令以后
反馈服务或者是反馈回你需要播放的内容
语音信号前处理包括
很多前处理的算法
在这里简单给大家介绍一下
像回声消除 信号接入以后一般都会进入回声消除
这跟你的麦克风的个数也有关 比方说
你要做4麦或者6.1环正
或者是8.1 甚至双环正
等等 这些环正进入以后 一般都是每个
麦克风都要做一路AEC
做AEC以后像波速成型
bean forming 声源定位DOA
然后也要做降噪 dereverberation
也要做去混响 最后要做AGC
这样处理以后 基本上人是在
1米到10米之内你随便
站在哪一个地方 我们听到的声音是恒定不变的
除了这些算法以后 我们还会
做一些只能待语音交互
比方说大家可以看到很多语音合成
刚才KWC已经介绍
那么本地的语音识别
ASR 或者是声纹识别
SPR这个都是各个公司想要较劲的
或者是核心技术所在
我们现在介绍一下语音识别以及唤醒的性能
语音识别方案的好坏其实有三大要素
第一个是唤醒率 第二个是误唤醒率
第三个是识别率
左边这个测试项目大家可以看一下
它的参数是我们从TI的以下第三方
拿到的数据
也可以看到 从误唤醒率
现在是1-3 一次到两次每天
其实亚马逊的测试标准是3次每天
也就看到这个标准是低过亚马逊
是低过亚马逊的测试标准
符合亚马逊的要求
看到其他一米
或者三米的语音识别率
都达到95%
KWS 1米的唤醒率甚至高达99%
这个测试条件我相信大家
它是有本地语音识别
有50条内置磁条
测试是采用第三方6+1的迈克阵列的环阵
现在介绍一下TI C674X语音信号处理前端 这个是通过这框图我们可以看到C674X 是通过TI的麦克风正列 麦克风正列进入TId ADC 然后把ADC通过FRS接口输入到C674X 然后通过FRS传给我们的RM 前端 RM再通过 Ylink chip WiFi 通过源传出到云端 整个链路你看到基本上红色的这条线路 是检测关键字 我们一般称为KWS 蓝色的这一边一般是云分析命令以后 反馈服务或者是反馈回你需要播放的内容 语音信号前处理包括 很多前处理的算法 在这里简单给大家介绍一下 像回声消除 信号接入以后一般都会进入回声消除 这跟你的麦克风的个数也有关 比方说 你要做4麦或者6.1环正 或者是8.1 甚至双环正 等等 这些环正进入以后 一般都是每个 麦克风都要做一路AEC 做AEC以后像波速成型 bean forming 声源定位DOA 然后也要做降噪 dereverberation 也要做去混响 最后要做AGC 这样处理以后 基本上人是在 1米到10米之内你随便 站在哪一个地方 我们听到的声音是恒定不变的 除了这些算法以后 我们还会 做一些只能待语音交互 比方说大家可以看到很多语音合成 刚才KWC已经介绍 那么本地的语音识别 ASR 或者是声纹识别 SPR这个都是各个公司想要较劲的 或者是核心技术所在 我们现在介绍一下语音识别以及唤醒的性能 语音识别方案的好坏其实有三大要素 第一个是唤醒率 第二个是误唤醒率 第三个是识别率 左边这个测试项目大家可以看一下 它的参数是我们从TI的以下第三方 拿到的数据 也可以看到 从误唤醒率 现在是1-3 一次到两次每天 其实亚马逊的测试标准是3次每天 也就看到这个标准是低过亚马逊 是低过亚马逊的测试标准 符合亚马逊的要求 看到其他一米 或者三米的语音识别率 都达到95% KWS 1米的唤醒率甚至高达99% 这个测试条件我相信大家 它是有本地语音识别 有50条内置磁条 测试是采用第三方6+1的迈克阵列的环阵
现在介绍一下TI C674X语音信号处理前端
这个是通过这框图我们可以看到C674X
是通过TI的麦克风正列
麦克风正列进入TId ADC
然后把ADC通过FRS接口输入到C674X
然后通过FRS传给我们的RM
前端 RM再通过
Ylink chip WiFi 通过源传出到云端
整个链路你看到基本上红色的这条线路
是检测关键字
我们一般称为KWS
蓝色的这一边一般是云分析命令以后
反馈服务或者是反馈回你需要播放的内容
语音信号前处理包括
很多前处理的算法
在这里简单给大家介绍一下
像回声消除 信号接入以后一般都会进入回声消除
这跟你的麦克风的个数也有关 比方说
你要做4麦或者6.1环正
或者是8.1 甚至双环正
等等 这些环正进入以后 一般都是每个
麦克风都要做一路AEC
做AEC以后像波速成型
bean forming 声源定位DOA
然后也要做降噪 dereverberation
也要做去混响 最后要做AGC
这样处理以后 基本上人是在
1米到10米之内你随便
站在哪一个地方 我们听到的声音是恒定不变的
除了这些算法以后 我们还会
做一些只能待语音交互
比方说大家可以看到很多语音合成
刚才KWC已经介绍
那么本地的语音识别
ASR 或者是声纹识别
SPR这个都是各个公司想要较劲的
或者是核心技术所在
我们现在介绍一下语音识别以及唤醒的性能
语音识别方案的好坏其实有三大要素
第一个是唤醒率 第二个是误唤醒率
第三个是识别率
左边这个测试项目大家可以看一下
它的参数是我们从TI的以下第三方
拿到的数据
也可以看到 从误唤醒率
现在是1-3 一次到两次每天
其实亚马逊的测试标准是3次每天
也就看到这个标准是低过亚马逊
是低过亚马逊的测试标准
符合亚马逊的要求
看到其他一米
或者三米的语音识别率
都达到95%
KWS 1米的唤醒率甚至高达99%
这个测试条件我相信大家
它是有本地语音识别
有50条内置磁条
测试是采用第三方6+1的迈克阵列的环阵
视频报错
手机看
扫码用手机观看
收藏本课程
视频简介
1.2 TI C674X DSP 语音信号处理方案及语音识别三要素
所属课程:TI 针对语音识别应用的嵌入式处理器解决方案
发布时间:2017.08.24
视频集数:3
本节视频时长:00:03:46
智能音箱成为了各领域关注的重点,其核心技术是语音识别技术。除了智能音箱,语音识别技术还能用于哪些应用场景?其核心部分是如何工作的?设计及考量语音识别技术的要素有哪些?如何利用TI提供的方案开启语音识别的设计?在本系列培训视频中,将会详细讲解。
//=$v1;?>
//=$v['id']?>//=$v['down_category']?>//=$v['link']?>//=$v['is_dl']?>//=$v['link']?>//=$v['name']?>//=$v['name']?>
//=$v['id']?>//=$v['down_category']?>//=$v['path']?>//=$v['is_dl']?>//=$v['path']?>//=$v['name']?>//=$v['name']?>
////=count($lesson['bbsinfo'])?>
//=$elink?>//=$elink?>//=$tags[0]?>//=$tags[0]?>//=$elink?>//= $elink?>//=$tags[1]?>//=$tags[1]?>
//=$lesson['bbs'];?>
//=count($lesson['bbsinfo'])?>