MSP430

低能耗加速器（LEA）性能

Loading the player...

在接下来的几张幻灯片中，我将通过考察 LEA 周期和能效来谈谈 LEA 的性能。正如前面所述， LEA 是一款用于执行信号处理的高效加速器。让我们更仔细地考察 LEA 的性能，例如，使用 LEA 而非 CMSIS-DSP 库的 16 位复数 256 点 FFT，大约比 CM-0+ 快 39 倍，比 C-M3 快 8 倍，而且比此处的 C-M4F 快 3 倍。此外，还注意到许多执行 512 点 FFT 的周期都相当线性。仅就执行 FFT 而言，这也是显著的性能提升，尤其是相对于 C-M0+ 内核。如果您看一看使用加速器 LEA 执行 256 点复数 FFT 相对于未加速情况下的耗能影响，您会发现，在未加速情况下，只有一个传统 CPU 用于计算 FFT，而这不包括应用程序的其他部分；看一看执行类似操作所需的纯 CPU 周期，您会发现，LEA 可以显著改善执行时间。使用 LEA 的平均 [听不清] 要慢于 CPU。而最终这就表现为采用 LPM0 执行 FFT 的总耗能约有 27 倍的耗能改善。如果看一看 LEA，其耗能已在右侧列出，它的耗能改善约有 20 倍。这表示正在由 LEA 执行特定任务且由 CPU 以并行方式执行单独任务的应用程序。现在，当然，了解 LEA 对整个应用程序的总体影响也非常重要。这当然会因您的应用程序不同而存在差异。在我们的示例中，我们以每秒从麦克风输出中采集 8kHz 样本的采样率从 ADC 获得 256 个样本。我们可以在使用 LEA 和不使用 LEA 的两种情况下执行复数 256 点 FFT。然后，我们将测量使用 LEA 加速的 FFT 与未加速 FFT 的系统耗能。请注意，此耗能包括 ADC、麦克风、模拟前端，并且显示器处于活跃状态。看看接下来两张幻灯片上给出的结果。您将看到在使用 LEA 的条件下执行 FFT 相比不使用 LEA 的情况，能效提升约 20 倍且速度提升约 14.5 倍。您在此可以看到， MSP430 以 8 兆赫运行，只需约 2,680 微秒即可执行 256 点复数 FFT。如果不使用 LEA，执行此操作在兆赫频率下约需 9.7 毫秒。您还将在此观察到平均电流包括组合在一起的信号处理 BoosterPack 以及 Sharp LCD BoosterPack。不过，再来看看 LEA 如何影响整个应用程序也许更有用处。此例情况相同。我们对 ADC 采样，执行 FFT，然后刷新显示屏。现在，LEA 产生的总体影响是将能效提高约 1.4 倍。它还将应用时间缩短 21%，这意味着主 CPU 现在能够完成更多任务。让我们来看看 LEA 与 MSP432 仅在执行 FFT 方面的性能对比情况。 MSP432 基于 Cortex-M4F，只需 1.5 毫秒即可执行 256 点复数 FFT。在耗能比较方面，仅 LEA 的能效就比 MSP432 大约高 3.3 倍。在此情况下，LEA 可通过两种方式帮助您的应用程序。虽然使用 16 位 MCU 仍能够处理您的主应用程序，但却在处理、信号处理以及实时处理方面面临着计算限制。而使用 LEA 可以为您的主应用程序减轻信号处理负载，使主 CPU 能够并行执行任务，从而提高应用程序吞吐量。除并行计算外，另一方面， LEA 还能够帮助降低您的系统耗能，您可以将信号处理功能卸载至加速器。如先前幻灯片中所见，显然，LEA 能够降低系统耗能，同时还能够以显著加快的速度执行信号处理任务

在接下来的几张幻灯片中，

我将通过考察 LEA 周期和能效来谈谈 LEA 的性能。

正如前面所述， LEA 是一款用于执行信号处理的

高效加速器。

让我们更仔细地考察 LEA 的性能，例如，

使用 LEA 而非 CMSIS-DSP 库的 16 位复数 256 点 FFT，

大约比 CM-0+ 快 39 倍，

比 C-M3 快 8 倍，而且比此处的 C-M4F 快 3 倍。

此外，还注意到许多执行

512 点 FFT 的周期都相当线性。

仅就执行 FFT 而言，这也是显著的性能提升，

尤其是相对于 C-M0+ 内核。

如果您看一看使用

加速器 LEA 执行 256 点复数 FFT 相对于未加速情况下的耗能影响，

您会发现，在未加速情况下，只有一个传统 CPU

用于计算 FFT，而这不包括

应用程序的其他部分；看一看执行类似操作

所需的纯 CPU 周期，

您会发现，LEA 可以显著改善执行时间。

使用 LEA 的平均 [听不清] 要慢于 CPU。

而最终这就表现为采用 LPM0 执行 FFT 的总耗能

约有 27 倍的耗能改善。

如果看一看 LEA，其耗能已在右侧列出，

它的耗能改善约有 20 倍。

这表示正在由 LEA 执行

特定任务且由 CPU 以并行方式执行

单独任务的应用程序。

现在，当然，

了解 LEA 对整个应用程序的总体影响也非常重要。

这当然会因您的应用程序不同而存在差异。

在我们的示例中，我们以每秒从麦克风输出中采集 8kHz 样本的

采样率从 ADC 获得 256 个样本。

我们可以在使用 LEA 和不使用 LEA 的两种情况下

执行复数 256 点 FFT。

然后，我们将测量

使用 LEA 加速的 FFT 与未加速 FFT 的

系统耗能。

请注意，此耗能包括

ADC、麦克风、模拟前端，并且

显示器处于活跃状态。

看看接下来两张幻灯片上给出的结果。

您将看到在使用 LEA 的条件下执行 FFT 相比不使用 LEA 的情况，

能效提升约 20 倍且速度提升

约 14.5 倍。

您在此可以看到， MSP430 以 8 兆赫运行，

只需约 2,680 微秒即可执行 256 点

复数 FFT。

如果不使用 LEA，执行此操作在兆赫频率下约需 9.7

毫秒。

您还将在此观察到平均电流

包括组合在一起的信号处理 BoosterPack

以及 Sharp LCD BoosterPack。

不过，再来看看 LEA 如何影响整个

应用程序也许更有用处。

此例情况相同。

我们对 ADC 采样，执行 FFT，

然后刷新显示屏。

现在，LEA 产生的总体影响是将能效提高约 1.4

倍。

它还将应用时间缩短

21%，这意味着主 CPU 现在能够完成更多任务。

让我们来看看 LEA 与 MSP432 仅在执行 FFT 方面的

性能对比情况。

MSP432 基于 Cortex-M4F，

只需 1.5 毫秒即可执行 256 点复数 FFT。

在耗能比较方面，仅 LEA 的能效就比 MSP432

大约高 3.3 倍。

在此情况下，LEA 可通过两种方式帮助您的应用程序。

虽然使用 16 位 MCU 仍能够处理您的

主应用程序，但却在处理、信号处理以及实时处理方面

面临着计算限制。

而使用 LEA 可以为您的主应用程序

减轻信号处理负载，使主 CPU 能够

并行执行任务，

从而提高应用程序吞吐量。

除并行计算外，

另一方面， LEA 还能够帮助

降低您的系统耗能，

您可以将信号处理功能卸载至

加速器。

如先前幻灯片中所见，

显然，LEA 能够降低系统耗能，

同时还能够以显著加快的速度执行信号处理任务

视频报错

手机看

扫码用手机观看

收藏本课程

未学习 MSP430 16位MCU上的信号处理简介
00:00:41 播放
未学习信号处理概述
00:04:31 播放
未学习什么是低能耗加速器（LEA）外设？
00:01:20 播放
未学习低能耗加速器（LEA）性能
00:04:38 播放中

播放中
未学习深入研究低能耗加速器（LEA）外设
00:02:03 播放
未学习低能耗加速器（LEA）程序员模型
00:01:53 播放

视频简介