DTW算法在嵌入式语音识别系统中的应用研究

时间:2022-08-19 03:44:26

DTW算法在嵌入式语音识别系统中的应用研究

摘 要:现代社会的各个领域对语音识别系统的要求不同,使得该系统特性的差异性非常的大,所以该系统的开发需要针对一定的指标。该文就相关的语音识别系统进行了简要的分析,特别分析了动态时间规整算法(DTW)在嵌入式语音识别系统中的应用。

关键词:语音识别系统 动态时间规整 嵌入式

中图分类号:TP3 文献标识码:A 文章编号:1674-098X(2014)03(b)-0071-01

随着有关于嵌入式系统的软件和硬件技术的进步,语音识别系统得到了全面的应用[1]。由于嵌入式系统受到各种软硬件的约束,该系统通常运行的是特定的任务[2,3]。所以开发者可以优化软硬件资源、减小规模、降低成本。但这对于语音识别系统的效率和准确度有了更高的要求[4]。DTW算法与HMM等算法相比较而言,针对小词汇量语音识别系统,其准确率与HMM等复杂算法几乎相同。

1 DTW算法

动态时间弯曲(Dynamic Time Warping,简称DTW)是把时间规整和距离测度结合起来的一种非线性规整技术。设:

(1)参考模板特征矢量序列为:c0,c1,…,cp;

(2)输入语音特征矢量序列为:d0,d1,...,,dq p≠q。

那么,DTW就是要计算函数D,从而使c和d之间的差别最小。

2 DTW在线并行算法

2.1 算法描述

DTW在线并行算法对于并行性的小词汇语音识别系统特别适用。此方法第一步对问题分解,然后在多个运算单元中单独的计算已知模式和未知模式之间的距离,并且对每个运算单元进行的计算分解。在DTW运算时要预先分配大小一定的内存。最后一步是将每一个单元的运算结果输入到决策模块,得到最终结论。

算法框图如图1所示,按照时间顺序将计算出的未知语音特征矢量输入到各个DTW流水线。然后由决策模块依据各个流水线的计算结果以及其他信息得出结论。但由于每个参考模式的长度不同,各条流水线的计算时间是不同的,因此每条DTW流水线会设置一个完成标志位Pi(1≤i≤N),依据这些完成标志,决策模块对已经完成计算的流水线结果进行处理。同时该算法还可以通过识别历史来提前终止没有完成的计算步骤。

2.2 算法分析

令特征矢量的维度为l,未知模式的长度为k,参考模式的个数为n,参考模式的总长度为p,局部判决函数的水平跨度为w,流水线条数为b。流水线的距离矩阵A的窗口平均大小为wn/p,令t为特征向量的数据类型所占的字节数,则OP-DTW算法所需的内存为wnt/p Byte。当b≥n时,算法所需时间为经典DTW的1/n;当b

3 结语

该文对一种DTW在线并行算法进行了分析,该算法相对减少了由于数据引起的等待时间;提高了DTW的并行度,并充分挖掘出硬件的计算功能,减少处理的时间。由于DTW的适用性,该算法适合一维非线性数据的匹配问题。

参考文献

[1] 林常志.基于统计的语音识别方法分析报告[R/OL].(2003-12-26)[2009-06-13].http:///data/林常志语音识技术报告.net.

[2] 李昱,林志谋,黄云鹰,等.基于短时能量和短时过零率的VAD算法及其FPGA实现[J].电子技术应用,2006,32(9):110-113.

[3] 谢秋云,肖铁军.语音MFCC特征提取的FPGA实现[J].计算机工程与设计,2008,29(21):5474-5475,5493.

[4] 高谦,张国杰,张树才.基于FPGA的高性能MFCC特征参数提取[J].通信技术,2008,41(6):153-154,157.

上一篇:鲁西南地区小麦抗病减灾防控技术研究 下一篇:3E视角下校企合作应用型人才培养的现状及途径...