基于语义理解的音频内容管理机制研究

来源 :西南科技大学 | 被引量 : 0次 | 上传用户:momoyangli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着音频资源的日益增多和网络多元化服务质量的不断提高,由此带来的复杂性使得难以对网络中的音频资源进行有效管理,究其原因是忽略了音频资源内容语义的管理,从而导致了信息孤岛的难于理解且相互分离。本课题以音频语义理解为基点,建立统一且高效的音频内容管理机制。针对UCL标引的音频资源信息,本论文主要从数字音频水印管理和音频语义分类检索两方面展开研究,并提出了相应的算法模型设计方案及对应的仿真验证分析。论文主要研究内容如下:   (1)研究基于UCL标引的数字水印音频语义管理技术,提出基于UCL的RBF神经网络双重语义水印算法,该方法用UCL技术对音频资源标引,设计基于UCL的音频语义标引框架,并建立数字音频语义水印模型。在模型中,用RBF神经网络自适应选择水印嵌入的最佳音频数据段,用小波变换提取所选音频段的近似分量和细节分量,并在两种分量中嵌入不同的语义信息。用形成的双重语义水印实现语义信息和原始音频信号一体化的传输,并用同步码技术解决水印信息的有效检测与监督。实验结果表明:在嵌入水印为信息量较大的语义信息时,本文采用的方法仍有较好的鲁棒性和不可听性,同时,同步码技术可有效保证水印信息的检测和监督,并改善了传输中的抗同步攻击能力。   (2)针对音频特征向量无法表示音频信息多语义特性及各语义间的相关性,提出了基于张量UCL的音频语义特征表征方式,将音频信息表示为三阶张量,并构建多语义张量空间。在此空间中,张量语义离散度(TSD)能有效聚集具有相同语义的音频资源,通过计算各音频资源的TSD来完成对音频资源的分类。为有效处理TSD分类的经验知识以用于对未知语义信息的音频自动分类,构建了RBF张量神经网络(RBFTNN)。实验结果表明,在多语义分类的情况下,TSD算法的分类性能明显优于当前典型的GMM算法;通过与支持向量机(SVM)学习模型相比可知,基于TSD的RBFTNN模型分类学习的准确率明显优于基于TSD的SVM模型。  
其他文献
本文首先对超宽带(UWB)天线的基本性能参数以及UWB天线设计所采用的数值计算方法进行了简单的介绍,然后对蝶形UWB天线进行了理论分析,并在此基础上研究并设计了5GHz频段单带
无线通信因其巨大的潜在市场,已成为通信领域研究的热点和众多通信厂商竞逐的制高点。当今的无线通信终端设备,其最核心的部分是SoC(System on Chip:片上系统)芯片。在无线通信
随着社会的发展和技术的不断进步,基于视频的监控和处理技术已经从模拟化、数字化、网络化发展到了智能化,监控方式也从纯人工发展到了半人工以及部分应用的全智能化,如人头
3G业务正式商用一周年之际,中国联通已建成全球最大的 WCDMA网络,3G用户突破1000万户大关,这标志着中国将在全球通信领域占据越来越重要的地位。技术的加速演进以及大规模的网络
随着互联网产业在全球的迅猛发展,人们主要通过互联网学习的方式获取知识。然而在广袤的互联网信息海洋里,学习资源的大量涌现,学习者很容易出现知识迷航、学习主题漂移的现
近年来,移动通信技术正面临着由2G向3G/LTE发展。随着空口速率提升的同时,移动通信业务也获得了迅猛的发展,由传统单一的语音业务向更加丰富的多媒体业务发展,如多媒体消息、视频
电力设备的监控一直都是人们研究的重点,如何在不停电、不接触的环境下检测电气设备的故障信息成为近期人们研究的热点。电力设备在运行状态下的热分布是判断设备状态是否良好
认知无线电是解决当前频谱资源匮乏的热门技术,它通过感知无线环境,寻求可用频谱资源,进行智能、动态地频谱选择,打破了传统的以无线通信系统固定划分频谱资源的方式,从而提高了频
光电经纬仪是一种广泛应用于航空航天任务的光学测量仪器,其主要功能是实时提供目标的飞行图像,记录目标飞行轨迹,为指挥中心决策提供数据支持。光电经纬仪提供的图像源一般包含可见光图像和红外图像。本文的研究工作基于某光电经纬仪的红外图像展开。由于系统设计和硬件性能的原因,该光电经纬仪红外图像空间分辨率低,噪声大,并且在图像四周有固定的强噪声干扰。该图像质量差,影响了操作人员的操作和决策人员的判断,需要对图
近年来无线Mesh网络(WMNs)凭借其低成本接入互联网和高效的扩展性等优势而受到网络领域的关注。但无线Mesh网络由于吞吐量有限,可靠性低而难以满足高清视频,文件共享以及网络游戏