声纹识别研究综述

时间:2022-09-04 08:38:30

声纹识别研究综述

摘 要:声纹识别是移动设备中最容易实现、最有应用性和经济性最高的生物特征。本文叙述了声纹识别的特点,历史与现状,影响声纹识别性能的因素,声纹识别系统框架的搭建,以及声纹识别的应用前景,指出声纹识别必将掀起移动设备和移动互联网新的篇章。

关键词:声纹识别;生物特征;移动设备

1前言

当今,随着移动设备以及移动互联网的发展,各种生物特征技术逐渐从国防安全领域走入移动互联网领域,比尔・盖茨说:“以人类生物特征(指纹、语音、脸相等)进行身份验证的生物识别技术,在今后数年内将成为IT产业最为重要的技术革命。”

声纹识别技术是身份验证技术-生物特征识别技术的一种,与其他身份验证技术相比,声纹识别更加方便、自然,且具有比较低的用户侵犯性,这是声纹识别技术在应用上的显著优势。另外,语音的采集设备比较简单,获取语音的识别成本低廉,使用简单。现在无处不在的语音通信网络,如固定电话、移动通信和互联网等,语音的获取非常方便,这为声纹识别技术的应用提供了良好的条件。而且声纹识别技术的算法复杂度较低,这也是其他身份验证技术所不可比拟的。

2 声纹识别研究

2.1声纹识别定义

声纹识别,简单来说就是根据语音来自动识别说话人身份的技术。根据实际应用,声纹识别通常可以被划分为两种具体任务,分别为:声纹辨识(Speaker Identification)和声纹确认(Speaker Verification)[4]。

声纹辨识任务的目的是将输入的未标记的语音样本确定为一组已知的说话人中的某一个,是一对多的问题。

声纹确认的目标是确定输入的测试语音中是否存在某一声明的说话人,这是一个一对一的问题,可以被看成是一个判决结果为“True”和“False”的两类判决问题。

声纹识别按照是否受语音内容(文本)的限制又可以分为文本相关声纹识别和文本无关声纹识别。文本相关说话人识别要求说话人提供指定语音的语义内容,可以用在使用者比较配合的场合,例如关键部门的出入控制,并且语义内容(如密码)可以通过语音识别后作为说话人身份认证的补充信息来增加系统的安全系数,另外文本内容的固定,可以一定程度上提高声纹识别系统的性能;而文本无关声纹识别不关心语音的具体语义内容,这与实际应用中的大多数情况相符,但正是由于其与文本无关的特点,决定了其识别判决的难度加大,因此训练和测试时都需要较长的语音。

2.2影响声纹识别性能的因素

对于人的个体来说,随着时间的变化、年龄的增长或者健康状况的变化等,不同时间所产生的语音都会随之发生或多或少的变化,这些都是影响声纹识别的因素。我们很容易就能感受到早晨刚起床时的声音和白天工作时的声音有着些许差异,人年轻时的声音和年老时的声音差异更加明显,另外由于说话人的声音是由个人的声道决定的,当人处于生病、紧张、高兴、愤怒等不同的健康状况和心理状态时,语音也会出现与平时明显的不同,从而影响声纹识别的性能。

但是,目前的大多数的研究工作中针对的主要是另外两个影响声纹识别性能的重要因素:信道影响(譬如不同的手机麦克风的影响)和噪声影响。

2.3声纹识别系统基本框架

和大多数模式识别问题类似,声纹识别也包括两部分:注册和测试。在注册部分,需要为系统提供注册语音样本,系统从这些语音样本里提取与说话人相关的信息(特征参数),通过模型训练算法为目标人建立语音模型。在测试部分,需要待测试的说话人提供测试语音样本,系统提取测试语音的与说话人相关的特征参数,来与声明的目标人模型进行模式匹配,从而做出判决。

2.4声纹识别技术的应用

近些年来声纹识别获得了非常多的关注和广泛的应用,其重要应用主要有以下几个方面:

(1)信息安全。在通信语音数据中,对恐怖不法分子进行检索、追踪及监控,帮助安全部门快速发现有价值的迹象和情报,在危机来临之前,能够做出迅速反映,及时阻止恐怖或者非法事件的发生,维护国家安全及稳定。美国在追踪本拉登等的过程中就广泛的使用声纹识别技术。

(2)电话银行及网上用户登录等领域说话人身份核对。鉴于密码的安全性不高,为了提高安全性,还可以采取一些其他措施,如密码和声纹识别双保险,目前很多应用场景是密码+短信验证,如果使用声纹验证代替短信验证,可以节省一定的运营成本。

(3)公安司法。对于各种电话勒索、绑架、电话人身攻击等案件,声纹识别技术可以在一段录音中查找出嫌疑人或缩小侦察范围;声纹确认技术还可以在法庭上提供身份确认的旁证。

(4)军事和国防上的应用。国际军事战略通信情报收集,对国际特定的(军事单位(如美国中央情报局,联邦调查局,国家安全局等重要情报中心)和军事行政机构(各国大使馆,国家政府),重要军事研究机构,军事基地的语音通讯进行自动监控;对政府首脑等特定人进行监控;在通过电话发出军事指令时,可以对发出命令的人的身份进行确认(敌我指战员鉴别)。目前该技术在国外军事方面已经有所应用。

(5)保安和证件防伪。如机密场所的门禁系统。又如声纹确认技术可集成到信用卡、银行自动取款机、门、车的钥匙卡、授权使用的电脑、以及特殊通道口的身份卡上,使之成为具备自动鉴别能力的智能卡。持卡人将自己的语音信息记录在卡上,使用时持卡人只要将卡插入专用机的插口上,并读出指定密码,只有在身份确认通过后,持卡人才能进行其它操作。同样可以把含有某人语音特征的芯片嵌入到证件之中,通过上面所述的过程完成证件防伪。

(6)多媒体信息检索。随着网络和各种媒体娱乐技术的发展,人们想对对特定人的音视频内容进行快速检索,从而能够快速定位到我们感兴趣的人的节目内容。基于声纹识别技术的说话人分割、聚类技术对于在大型数据语音库和电视广播新闻中的信息查询和检索是非常有用的,使得根据说话人的身份在海量存储的多媒体数据中来检索特定的音视频片段成为可行的方法。

3总结

声纹识别作为人类生物特征识别的一个重要方向,属于人工智能的重要分支,相信在未来,随着人工智能技术的发展,会有更多的畅想空间,更多的产品服务于人类。

参考文献

[1] G. Doddington, “Speaker recognitionDIdentifying people by their voices,”Proceedings of the IEEE, vol. 73, no. 11, pp. 1651C1664, 1985.

[2] J. Campbell Jr, “Speaker recognition: A tutorial,” Proceedings of the IEEE, vol. 85, no. 9, pp. 1437C1462, 1997.

[3] D. Reynolds, T. Quatieri, and R. Dunn, “Speaker verification using adapted Gaussian mixture models,” Digital signal processing, vol. 10, no. 1-3, pp.19C41, 2000.

上一篇:城建工程地下室桩基施工技术研究 下一篇:高中语文教学与审美情感培养