【摘 要】
:
本文提出了一种基于分段的快速音频检索算法。该算法将检索目标划分成多个较小的片段,每个片段可以独立进行检索;检索过程中使用检索窗控制参与检索的片段及数量。该算法的计算量小、检索速度可调,有一定的顽健性(Robustness)并且能获得较高的检出率和正确率,适用于从未知音频数据源中检索任意长度的指定音频数据及实时应用场合。
【出 处】
:
中国人工智能学会第10届全国学术年会
论文部分内容阅读
本文提出了一种基于分段的快速音频检索算法。该算法将检索目标划分成多个较小的片段,每个片段可以独立进行检索;检索过程中使用检索窗控制参与检索的片段及数量。该算法的计算量小、检索速度可调,有一定的顽健性(Robustness)并且能获得较高的检出率和正确率,适用于从未知音频数据源中检索任意长度的指定音频数据及实时应用场合。
其他文献
为了判定工作流管理系统中过程定义的执行有效性,本文在深入分析工作流过程中基本关系的基础上,给出了一系列将过程定义转化为Horn集的规则,证明了工作流过程的执行有效性与Horn集的不可满足性之间的对应关系,从而得到了一种通过使用单元归结或输入归结判定Horn集的不可满足性来确定对应工作流过程执行有效性的方法。
针对炼油厂柴油调合生产这个多输入、多输出对象,提出了以柴油调合50%馏程、酸度、十六烷值为质量指标带有静态经济指标的柴油连续调合生产优化方法及基于改进BP神经网络预测控制模型。仿真计算证明本文的线性优化方法能计算柴油调合生产最优配方,在满足生产能力约束和产品质量指标的前提下可实现组分油最优利用并获得最大利润。
本文采用SRN网络模型结合RTRL算法在线辨识非线性被控对象,以另一个SRN网络模型为控制器,并将二者级联;以控制器的输入作为被控对象输出的期望值,求出跟踪误差后,用BPTM算法训练该控制器并使其成为对象的逆模型。文中推导出了权系数更新的计算公式,仿真结果表明该算法具有良好的跟踪性能。
本文主要讨论了一种稳定的自适应模糊控制器。首先回顾了离散时间非线性系统的自适应控制问题,然后构造了一个自适应模糊控制器并给出了闭环系统的稳定性分析,最后我们给出了一个仿真实例,仿真结果显示该控制器是有效的。
本文借鉴遗传算法(GA)中的变异思想,在禁忌搜索中引入了变异操作。根据搜索过程是否陷入局部最优而自动地对当前局部最优解实施变异操作,以期能改变搜索的方向,跳出局部最优,进而达到或逼近伞局最优。文中选用TSP Benchmark问题作为测试算例,以两种不同的算法产生初始解,进行了对比研究。实验表明:基于自适应变异的禁忌搜索,不仅可以提高解的质量,而且可以在一定程度上降低对初始解的敏感性。
本文给出了离散时间系统的准滑模,理想滑模,非理想滑模与准滑模带的概念,分析了现有的离散时间系统变结构控制滑模面的主要设计方法的优缺点,在此基础上提出了一种新方法,使所得到的变结构控制系统具有良好的性能。最后给出了一个数值仿真算例,证明了这种控制方法的有效性。
提出了一套人工动物的局部运动规律建模与模型的协同、随机连续切换方法,解决了开发有效的人工动物社会行为系统的一个关键技术问题。基于该方法开发了一个人工鱼社会行为系统,此系统能表现鱼的多种生命习性和智能行为。它能无限广义循环运行,有良好的人机交互性能。而且系统中鱼的外观、运动和行为在视觉上令人信服、逼真,不会出现动画角色‘突变’、‘突失’、‘跳变’不佳视觉效果。本文提出的人工动物局部运动规律建模与模型
本文提出基于人工生命的智能控制系统的概念和体系结构,给出基于人工脑的智能控制器,基于人工感官的反馈测量装置,基于人工器官的控制执行机构的概念及原理,以及拟人智能控制系统的示例拟人智能机器人的设计方案和研究方法。
三角形网格是计算机图形系统中描述物体表面的常用方法之一,但是由表面重建算法得到的网格模型通常比较复杂且无序,在进一步应用操作前需要进行后处理如网格简化、网格参数化和重采样等等。在网格优化处理过程中,如何保持网格边缘特征显得极其重要。本文首先利用微分几何特性确定出网格连接边的近似曲率,再将图像边缘检测中常用的双阈值方法和边缘连接方法扩展到三维网格表面的特征边提取。实验表明本文算法是快速且有效的。
1998年,T S Huang等人首次提出视频流的层次性结构表示,其中场景是最高层次的视频处理单元。随着研究工作的不断深入,需要提出一种比场景更高的视频处理单元即节目(Program)。一段持续数小时的节日类型丰富多彩的视频流,可能会被分割成上千上万个场景,此时如果用节目来组织视频流就能够更清晰化地看到视频的层次结构。另外,在视频节目自动分类(videogenre verification)的研究