一种识别说话者的新方法

来源 :智能计算机与应用 | 被引量 : 11次 | 上传用户:milkchewy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在能够自动识别视频中的说话者的系统中,大部分采用的是声音和唇部运动相结合的方法。文中则采用了另一种方法有效地达到了目的,即通过检测人体头部和手部的运动来鉴别说话者。基于演讲者在说话时通常会伴有头部运动或是手部运动,该方法既能实现说话者的检测,又能避免由于观测点过远而导致无法判断人唇部运动的局限性。在系统的实施过程中,运用了多种图像处理方法,并且对三帧差运动法做出了改善,使其能更高效、更准确地检测到头部和手部的运动。经过多个不同的视频测试后,本系统的F1score高达91.91%,从而验证了该系统的可行性。
其他文献
随着互联网信息技术不断的发展完善、工业化信息的推进以及多种网络的融合,无线局域网的应用领域不断扩大的今天,无线网络在给用户提供方便、快捷上网条件的同时,其安全问题也令
保证在线考试的公平和公正,是推广和实施在线考试的一个重要任务,由于Xvid是免费且开源的编解码器,易于使用,算法高效,可以很好地承担在线考试系统监控视频流的传输任务。结
考察了磷酸二氢钠、磷酸二氢铵、焦磷酸钠、硫酸锌、EDTA、水杨酸、苯甲酸和8-羟基喹啉等用作制备过氧化尿素的稳定剂对产物活性氧含量和收率的影响,筛选出合适的稳定剂.实验
目的通过了解农村居民对艾滋病基本知识、态度和个人性行为,从而探讨预防HIV的干预模式。方法随机选取罗定市龙湾镇1200名20~59岁的农民,用匿名调查表收集有关个人背景、艾滋