适用于多种伪造操作的数字语音取证方法研究

来源 :宁波大学 | 被引量 : 0次 | 上传用户：chaowei7838

【摘要】

：

【作者】

：

乌婷婷

【机构】

：

宁波大学

【出处】

：

宁波大学

【发表日期】

：

2020年01期

【关键词】

：

倒谱特征支持向量机数字取证深度学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着语音编辑软件功能的强大,对语音材料的修改和处理也越来越方便,而大多数情况下人耳往往很难感知到这类修改遗留的痕迹。事实上,一些不法分子很有可能通过这些语音编辑软件对语音材料进行伪装操作,从而达到不可告人的目的,这些伪造操作会对司法取证工作带来严重的干扰。尽管数字语音取证技术在近年来得到了不断的发展,但值得注意的是现有大多数的语音取证工作针对的是单一伪造操作,比如变调取证算法只可检测待测语音是否经过变调的伪造操作。这类仅适用于单一伪造操作的取证方法,尽管可以达到很高的检测率,但在实际场景中往往会因为取证者无法提前预知具体的伪造操作类型,而无法准确选择对应的检测算法,这样甚至很大概率会出现误判的结果。因此,如何对多种伪造操作的数字语音进行有效地检测是目前亟需解决的问题。本学位论文主要研究的内容为适用于多种伪造操作的数字语音取证方法。论文首先剖析了现有一些研究方法的思路、原理以及特点。实际上,目前数字语音取证领域很少有研究是针对多种伪造操作检测而展开的,同时针对多种伪造操作的取证算法尚存在不同库交叉实验的检测率不高、算法鲁棒性不强等问题。本学位论文选择了语音变调、低通滤波器、高通滤波器、加噪这四种最为常见的伪造操作展开研究,具体的研究内容主要包括以下三个方面:（一）首先对四种伪造操作的原理进行了剖析。为了进一步对多种伪造操作的数字语音取证工作进行研究,本学位论文根据现有主流的语音编辑处理软件以及语音数据库构建了一个多操作语音取证数据库。我们对TIMIT数据库中的原始语音分别进行四种不同伪造操作的处理,同时为每种伪造操作设置了四个不同的参数,每种伪造参数对应6300个语音样本,构建了共计100800个语音样本的特定TIMIT数据库;同时对UME数据库中的原始语音进行相同的伪造操作处理,每种伪造操作参数对应4040个语音样本,构建了共计64640个语音样本的特定UME数据库。（二）针对现有数字语音取证算法大多都只可检测单一伪造操作的问题,本学位论文提出了一种适用于多种伪造操作的检测算法。首先从时域和频域两个角度,对伪造语音进行差异性分析,研究表明原始语音受不同伪造操作的影响会留下不同程度的伪造痕迹。基于这些差异分析,进一步提出了基于倒谱声学特征的多种伪造操作检测算法。该算法对三种传统声学倒谱特征的提取过程进行研究和剖析,并设计了一个SVM组合多分类模型。实验结果表明,使用LFCC作为分类特征可以更有效地检测伪造语音。在TIMIT和UME数据库的库内实验中检测率保持在95%左右。而在不同数据库的交叉实验中,检测率也都在90%以上。同时为了验证对未知伪造操作的检测能力,我们将该算法与其他检测算法进行了实验比较。实验结果表明,该算法相较于现有检测算法对未知伪造操作的检测性能有明显的提升。（三）针对传统手工特征和SVM组合多分类的检测方法中存在算法复杂度较高的问题,本学位论文提出了两种基于深度学习的多种伪造操作检测算法。在第一种算法中,提出了一个包含七个卷积层组的卷积神经网络,其中特别设计了用于捕捉伪造痕迹的残差滤波器。实验结果表明,该算法在库间实验中检测率能达到96%以上,而在不同库交叉实验中检测性能有所下降,检测率在85%以上。在第二种算法中,提出了一种基于传统声学特征的长短时记忆网络。我们先固定了网络的基本框架,通过对比不同的倒谱特征,初步实验结果表明LFCC能够对四种伪造操作表现出较好的检测性能。再由此特征进一步对比不同层数的网络,确定网络层数为两层的LSTM网络更能够有效地鉴别原始语音和四种伪造语音。实验结果表明,该算法在库间实验中检测率基本在97%以上,而在不同库交叉实验中,检测率也可保持在88%左右。同时为了评估对未知伪造操作的检测能力,我们将这两种检测算法与其他检测算法进行实验比较。实验结果表明,这两种算法都可以有效地检测未知伪造操作。

其他文献

信仰空间的合法化进程 ——辽中蒲河村村庙的个案研究

改革开放以来,民间信仰呈现复兴趋势,各地开展民间信仰活动,信仰空间或被重建,或被改造,成为民众表达信仰诉求的重要场所。信仰空间是重要的村落空间组成部分,同一个信仰空间在不同的时期具有不同的功能,呈现出复杂的状态。随着社会的发展,人们对于民间信仰的态度有所转变,对信仰空间的重构就是对地域精神和文化的认同,体现出各个时期地方民众的文化选择。本论文从一个信仰空间所经历的合法化过程为切入点,采用“场域”的

学位

信仰空间村庙合法化

压电声子晶体中的间隙波传播

声子晶体是一种具有人工周期结构的复合材料。近年来随着压电、压磁等功能材料在声子晶体结构中的引入,声子晶体的应用范围得到了极大的扩展,如谐振器、滤波器、传感器和微流体操控等领域均可利用声子晶体的独特物理特性实现性能提升。然而随着技术发展,器件的频率逐渐提高（达到几个GHz）,压电压磁声子晶体的结构也越发复杂,多层和带有气隙的层状结构逐渐受到学者的青睐,在此,我们着重考虑,当压电、压磁声子晶体结构中存

学位

声子晶体间隙波压电平面波展开法

基于异构图学习的跨模态音频-图像哈希检索算法研究

学位

带有沟槽圆柱体的自由振动分析

圆柱体是生产和生活非常普遍的结构。近年来,有不少关于圆柱三维振动的研究,在一些近似方法研究中有人采用了切比雪夫多项式级数作为允许函数来研究圆形和环形平板、实心圆柱和空心圆柱的三维振动。结果显示了切比雪夫多项式在数值计算方面的稳定性,特别适合于高阶模态的计算。但是目前在圆柱体上开槽的研究却不多见。在圆柱体上开凹槽会改变边界条件,使它很难作为一个整体来计算,但我们仍将使用切比雪夫多项式级数和瑞利-里兹

学位

沟槽圆柱体瑞利-里兹法切比雪夫多项式频率振动

机械脱粒损伤对谷物储藏品质性状的影响研究

学位

利用格子Boltzmann方法预测多孔介质中非牛顿流体的渗透率

孔隙尺度下非牛顿流体模拟广泛应用于石油开采、生物医学中动脉瘤诊疗等领域,具有重要的实用价值和指导意义。由于非牛顿流体通常具有更复杂的本构方程,其粘度与剪切速率或速度梯度有关,传统计算方法难以有效处理这一问题。格子Boltzmann（LB）方法,作为一种具有动理学背景的介观数值方法,被广泛应用于非牛顿流体流动研究。它易于处理复杂边界、计算效率高、易于并行化,在模拟复杂流体流动时展现了极大优势。本文利

学位

孔隙尺度格子Boltzmann模型渗透率四参数生长法随机多孔结构

楔横轧轴类件温轧成形工艺理论研究

目前楔横轧轴类件成形技术主要是将坯料加热至完全再结晶温度以上,在整个轴类件成形过程中,加热能耗占总能耗的90%以上。因此降低温度轧制可以实现节能减排、绿色制造的目标,为企业带来经济效益,满足节约型社会需求。由于楔横轧轴类件成形过程复杂,轧制温度直接关系着轧件塑性状况和微观组织演变,若直接降低轧制温度,会导致轧件出现各种成形质量缺陷,甚至会损坏模具和轧机设备。本文开展楔横轧轴类件温轧成形技术理论研究

学位

楔横轧温轧成形工艺参数成形质量微观组织

I-nice聚类算法改进研究

近年来,无参数聚类算法是无监督学习领域的研究热点之一。无参数聚类算法的主要优点是在对给定数据集进行训练之前,不需要研究人员事先指定参数（例如,簇数目和初始簇中心）。在实际应用中,簇数目和初始簇中心往往是未知的,不恰当的事先指定反而会导致令人不满意的聚类结果,尤其是对于含有较多簇的复杂数据集。尽管存在一些专有的方法能对簇数目和初始簇中心进行优化,但是这些方法要么得出的聚类结果不稳定,要么计算复杂度高

学位

I-nice算法无参数聚类算法伽马混合模型核密度估计密度峰策略

在Λc+弱衰变过程中研究强子共振态的性质

强子共振态的性质是强子物理研究的热点之一。在传统的夸克模型框架下,强子包括介子和重子,然而在QCD框架下,还允许存在四夸克态,五夸克态,分子态,混杂态,胶球等色单态。虽然实验上发现的的大多数强子可以用传统的介子和重子来描述,但是还要很多强子共振态无法用传统的夸克模型来解释。特别是对于质量最低的轻标量介子和质量较低的重子激发态。近年来国际上的大科学装置也积累了许多有关轻标量介子和低质量重子激发态的实

学位

粲重子衰变手征幺正方法强子共振态不变质量谱

动态不确定环境下分布式决策技术研究

决策概念的应用是广泛的,几乎牵涉从个人生活到社会发展的方方面面。科学决策理论的产生与完善调动了生产资源的优化配置,促使了社会生产力的快速发展,极大程度改善了人们的生活水平。然而,随着工业技术和计算机科学的进一步发展,决策的概念与理论体系相对于管理学、决策论所关注的经典体系已发生深刻的拓展:1)决策环境由传统的静态确定环境向动态不确定环境变化;2)决策集已不再局限在数集,更多地体现为函数集与抽象集。

学位

分布式决策动态不确定环境泛函决策强化学习终值问题弹道逆推瓶颈指派协同定位狼群算法分布式系统仿真描述性信息流网络通信

适用于多种伪造操作的数字语音取证方法研究

与本文相关的学术论文