密文语音检索的语音认证研究

时间：2022-03-22 06:55:31

密文语音检索的语音认证研究

摘要：随着语音通信的飞速发展和各种语音产品的日益普及，数字音频逐渐成为最流行的多媒体应用之一。云作为一种提供计算资源的新方式，不仅仅可以提供无限的存储容量，而且不需要担心电量、空间和升级等诸多问题。但从密码学角度来说，云存储端不是可信任第三方。为此，将logistic映射以及猫脸变换技术结合在一起对语音进行加密，并基于语音的基音周期设计了一种具有隐私保护特性的密文语音检索方案。

关键词：感知哈希；可恢复水印；语音认证；基音周期；检索

中图分类号：G4文献标识码：Adoi：10.19311/ki.16723198.2017.06.082

3.3密文语音检索

将感知哈希作为水印嵌入到加密后的语音信号中从而得到含水印的密文语音，并上传到云服务器端，同时构建一个系统哈希表来存储相应的感知哈希值。当用户向云服务器管理员发送检索请求时，管理员可以在不下载、不解密加密语音的情况下对密文语音进行检索。首先根据水印嵌入算法的逆过程从密文语音中提取感知哈希值H1，随后将其与从系统哈希表中对应的感知哈希值H2进行匹配，根据式（6）求出二者的归一化汉明距离D（H1，H2）：

D（H1，H2）=11M∑M1p=1H1（p）H2（p），p=1，2，3，…，M（9）

假设T2为相似性阈值，且0

4性能分析与比较

4.1感知哈希性能

实验中采用的语音库为100个采样率为441kHz，16位量化的单声道语音。我们按照每帧1280个采样点将每个语音进行不重叠分帧，得到每个语音帧的基音周期生成感知哈希，计算每帧语音感知哈希值与其它各帧感知哈希值的归一化汉明距离，得到如图3所示的4950个结果，以及如图4所示的统计直方图。根据图3和图4中能够发现不同语音感知哈希值的归一化汉明距离主要分布在0.18-0.7之间。这个分布结果可近似于数学期望为0.4796，标准差为00791的高斯分布。设015为相似性阈值，即T2=0.15，可以计算出它的碰撞率为1.5312×10-5。由此可见，通过本文算法计算得到的感知哈希值有较好的唯一性和区分性。

直方图对语音进行常规信号处理，计算出处理前后语音的感知哈希值的归一化汉明距离。表1给出了在添加噪音、低通滤波、音量调节以及重采样、重量化等不同语音信号处理后的语音产生的感知哈希值与原始语音产生的感知哈希值之间的归一化汉明距离。可以得知，常规信号处理前后语音的感知哈希值的归一化汉明距离都小于0.1，说明本算法产生的感知哈希值的鲁棒性好。上述测试结果显示本文算法具有良好的实时性、区分性、唯一性和感知鲁棒性，这为其用于海量密文语音检索奠定了基础。

为保证语音云存储得安全性，首先，本文采用logistic映射与Arnold变换对语音做加密处理。下面实验采用的语音样本为单声道，采样率为44.1kHz，量化位数为16bits，长度为51200个采样点。图5（a）所示为原始语音波形，我们取Logistic混沌初值为0.001，同时Arnold变换a=2且b=3对其进行加密操作，图5（b）所示为加密后的语音。可以看出，加密前后得语音波形相差很大，加密效果良好。

将通过基音周期生成的感知哈希值嵌入到加密语音中，嵌入时的量化步长是0.05，得到如图6（a）所示的含水印语音。由图6（a）和图6（b）可见，嵌入感知哈希值前后的密文语音信号在波形上几乎没有差异，这表明感知哈希值的嵌入不影响密文语音的感知质量。将嵌有感知哈希的密文语音信号进行解密后得到的语音信号波形如图6（b）所示。可以看出，嵌有感知哈希值的密文语音完全可以进行解密操作，且解密后的语音波形与加密的语音波形基本相同，因此嵌入感知哈希值这一操作，并不影响语音的解密。

下面我们将分别从密钥敏感度对加密性能进行分析。为测试密钥的敏感性，我们将对系统的密钥做一些小的改变。比如，本文测试时利用的Logistic混沌初值为0.001，同时Arnold变换a=2且b=3，我们称系统密钥为K=（0.001，2，3），利用此密钥对语音进行加密。现在对混沌初值做修改，取初值为0.0011，Arnold变换的密钥a、b不变，即K′=（0.00111，2，3），并用修改过的密钥对语音进行解密。图7（a）为经过密钥K加密后得语音波形，图7（b）为使用错误的密钥K′对加密语音进行解密后的语音波形。由此可以看出，尽管密钥K与K′中只有k1与k′1的值相差00001，但该加密系统在进行若干次迭代后生成的混沌序列差别很大，所以不能正确的解密语音。这说明本算法的密钥敏感性良好。

4.3密文语音检索的准确性

为了评价密文语音的检索性能，下面将采用查全率R和查准率P这两个指标进行分析。设检索正确的语音个数为fT，检索丢失的语音个数fL，检索错误的语音个数fF，那么查全率R和查准率P的计算公式分别如下：

从语音库中任意选取4个语音，然后采用不同参数对其进行如表1所示的不同语音攻击，将攻击后的语音与剩余96个语音组成新的语音库。对新的语音库中的语音采取上述加密方式进行加密并将感知哈希嵌入到加密后的语音中，从而构成待检索的密文语音库。在检索过程中，把待检索的密文语音库中提取的感知哈希值与目标语音的感知哈希值进行匹配，假如计算所得的归一化汉明距离比阈值小，则判定为该语音的检索结果。本文所选相似性阈值T2=0.15，表2为经过不同语音处理后的查全率和查准率。

从表2中能够看到，经过噪声、低通滤波、音量调节等语音处理后，本文算法的查全率和查准率均为100%。综上分析，可以看出根据本文算法所产生的感知哈希在鲁棒性高于文献＼[38＼]的情况下，也取得了令人满意的查全率和查准率。

5结论

本文针对云环境下的大规模语音数据设计了一种基于Logistic映射和Arnold变换相结合的加密方法，保证了云存储的隐私性和安全性，随后设计了一种基于语音基音周期的感知哈希密文语音检索方法。本文方案的优势：（1）提出的基于Logistic映射和Arnold变换相结合的加密方法具有非常可靠的安全性，并且运算速度快，适合大规模数据的加密；（2）基于语音周期的感知哈希方法具有很强的鲁棒性和唯一性，由此提出的检索方式具有很高的查全率和查准率；（3）可以在不下载、不解密的情况下直接对密文语音进行检索。根据仿真结果可知，本文方案的唯一性良好，并且对常规语音攻击具有较好的感知鲁棒性，可以满足用户安全性和实时性的需求。

参考文献

[1]吴婧.基于感知哈希技术的音频检索方案研究[D].哈尔滨：哈尔滨工业大学，2008.

[2]孙圣和，陆哲明，牛夏牧.数字水印技术及其应用[M].北京：科学出版社，2004.

[3]刘瑞祯，谭铁牛.数字图像水印研究综述[J].通信学报.2000，32（8）：3945.

[4]I. Cox，M.Miller，J.Bloom.Digital Watermarking[J].Computing Milleux，2003.

[5]徐达文，王让定，鲍吉龙.基于听觉感知模型的自适应音频数字水印算法[J].计算机工程与应用，2006，（31）：6870.

[6]钱清.数字语音认证水印技术研究[D].成都：西南交通大学，2012.

[7]林蓝.密文语音检索与基于可恢退印的语音认证研究[D].成都：西南交通大学，2015.

[8]鲍长春，樊昌信.基于归一化互相关函数的基音检测算法[J].通信学报，1998，19（10）：2731.

[9]胡瑛，陈宁.基于小波变换的清浊音分类及基音周期检测算法[J].电子与信息学报.2008，30（2）：353356.

[10]王秋生，孙圣和.基于量化数字音频信号频域参数的水印嵌入算法[J].声学学报.2002，27（4）：380385.

密文语音检索的语音认证研究

文档上传者

热门标签更多>

热门推荐更多>

密文语音检索的语音认证研究

文档上传者

热门标签 更多>

热门推荐 更多>

热门标签更多>

热门推荐更多>