DTW算法在嵌入式语音识别系统中的应用研究

时间：2022-08-19 03:44:26

摘要：现代社会的各个领域对语音识别系统的要求不同，使得该系统特性的差异性非常的大，所以该系统的开发需要针对一定的指标。该文就相关的语音识别系统进行了简要的分析，特别分析了动态时间规整算法（DTW）在嵌入式语音识别系统中的应用。

关键词：语音识别系统动态时间规整嵌入式

中图分类号：TP3 文献标识码：A 文章编号：1674-098X（2014）03（b）-0071-01

随着有关于嵌入式系统的软件和硬件技术的进步，语音识别系统得到了全面的应用[1]。由于嵌入式系统受到各种软硬件的约束，该系统通常运行的是特定的任务[2，3]。所以开发者可以优化软硬件资源、减小规模、降低成本。但这对于语音识别系统的效率和准确度有了更高的要求[4]。DTW算法与HMM等算法相比较而言，针对小词汇量语音识别系统，其准确率与HMM等复杂算法几乎相同。

1 DTW算法

动态时间弯曲（Dynamic Time Warping，简称DTW）是把时间规整和距离测度结合起来的一种非线性规整技术。设：

（1）参考模板特征矢量序列为：c0，c1，…，cp；

（2）输入语音特征矢量序列为：d0，d1，...，，dq p≠q。

那么，DTW就是要计算函数D，从而使c和d之间的差别最小。

2 DTW在线并行算法

2.1 算法描述

DTW在线并行算法对于并行性的小词汇语音识别系统特别适用。此方法第一步对问题分解，然后在多个运算单元中单独的计算已知模式和未知模式之间的距离，并且对每个运算单元进行的计算分解。在DTW运算时要预先分配大小一定的内存。最后一步是将每一个单元的运算结果输入到决策模块，得到最终结论。

算法框图如图1所示，按照时间顺序将计算出的未知语音特征矢量输入到各个DTW流水线。然后由决策模块依据各个流水线的计算结果以及其他信息得出结论。但由于每个参考模式的长度不同，各条流水线的计算时间是不同的，因此每条DTW流水线会设置一个完成标志位Pi（1≤i≤N），依据这些完成标志，决策模块对已经完成计算的流水线结果进行处理。同时该算法还可以通过识别历史来提前终止没有完成的计算步骤。

2.2 算法分析

令特征矢量的维度为l，未知模式的长度为k，参考模式的个数为n，参考模式的总长度为p，局部判决函数的水平跨度为w，流水线条数为b。流水线的距离矩阵A的窗口平均大小为wn/p，令t为特征向量的数据类型所占的字节数，则OP-DTW算法所需的内存为wnt/p Byte。当b≥n时，算法所需时间为经典DTW的1/n；当b

3 结语

该文对一种DTW在线并行算法进行了分析，该算法相对减少了由于数据引起的等待时间；提高了DTW的并行度，并充分挖掘出硬件的计算功能，减少处理的时间。由于DTW的适用性，该算法适合一维非线性数据的匹配问题。

参考文献

[1] 林常志.基于统计的语音识别方法分析报告[R/OL].（2003-12-26）[2009-06-13].http：///data/林常志语音识技术报告.net.

[2] 李昱，林志谋，黄云鹰，等.基于短时能量和短时过零率的VAD算法及其FPGA实现[J].电子技术应用，2006，32（9）：110-113.

[3] 谢秋云，肖铁军.语音MFCC特征提取的FPGA实现[J].计算机工程与设计，2008，29（21）：5474-5475，5493.

[4] 高谦，张国杰，张树才.基于FPGA的高性能MFCC特征参数提取[J].通信技术，2008，41（6）：153-154，157.

DTW算法在嵌入式语音识别系统中的应用研究

热门推荐 更多>

热门推荐更多>