论文部分内容阅读
数据标注作为人工智能算法实现的重要环节,是机器学习和数据分析等领域的研究基础。而在中国,当前心血管病死亡占居民疾病死亡的40%以上,因此心电信号的实时监测与智能分析受到极大重视。为了实现此目标,必须首先实现心电信号的QRS波与心率参数的算法自动标注,因为它们不仅是心血管病智能诊断的研究基础,而且是心电仪器监测的目标参数,人工标注已然不能满足需求。目前基于各种原理的QRS标注算法在质量较好的单一数据库上的标注精度已经达到95%以上,但由于人体心电信号微弱且极易受噪音干扰,导致算法的鲁棒性与实用性较差。因此本文针对心率估计提出了基于多标注值融合的无监督算法,寻找每一段待标注心电信号的未知心率真值,提高心率估计的精度。本文从模拟多标注器/标注算法标注过程出发,对建立潜在心率标注真值与多标注值、与各个单一标注器的精度、与信号特征、与信号质量之间的关系进行了研究,以生成精度较高的心率多标注值融合结果,下面对本文所完成的主要工作进行总结。(1)使用基于多标注器的连续值标签融合模型用于心率估计,提出并选择了用于推测未知心率真值的线性回归模型中的心电信号特征向量构成,建立了未知心率真值与多标注值间的分布关系,并通过两者间的差值来评估单一标注器的未知精度,从而决定各标注器提供的标注值对最终的融合结果的贡献度。此模型使用期望最大化算法求解参数的极大似然估计和未知心率真值,通过测试实验证明此模型和均值法、中值法等连续值标签融合方法以及文中使用的最优单一标注器相比,精度改善最大达到17.46%、23.12%和42.23%。还使用测试实验时模型输出的各标注器精度作为权重计算验证数据集的多标签加权平均值,作为验证数据集的心率估计结果,其误差仍比其他心率估计方法小,且比测试实验结果的误差稍大,说明了模型的有效性、合理性以及模型面对未知数据时的鲁棒性。(2)在已有模型的基础上,提出加入了标注器偏置和贝叶斯先验分布的心率估计改进模型,其中标注器偏置用来修正单一标注器输出的标签值与潜在标签真值之间的关系,而标注器精度与偏置的先验分布则用来减少模型对于标注观测值的依赖,提高模型的鲁棒性。在此模型中还加入了标注器精度调节因子,用来标识待标注心电信号的信号质量,建立单一标注器精度与信号质量之间的关系。最后采用期望最大化算法以无监督的方式计算偏置、精度、未知标签真值的极大后验估计,并在此过程中,根据精度参数的先验分布,模拟精度的广义极大值分布,以设定精度阈值保证算法的收敛。最终通过实验验证了改进型模型对于心率估计精度的进一步提高与优化,其对比于前一模型、均值法、文中最优单一标注算法的误差改善最高达19.94%、26.38%和25.69%。(3)使用提出的模型及相同的参数设定对真实场景下的2000例动态心电信号进行了实验。与均值法相比,两种模型对心率估计的精度改善最高达到11.82%,14.84%;与最优单一标注器的心率估计结果相比,两种模型则分别实现了12.8%与18.2%的精度改进,实验结果表明了两种模型对于心率估计精度有不同程度的改进,并且验证了模型对于动态心电信号心率估计的鲁棒性。