论文部分内容阅读
随着信息技术的飞速发展,各种媒体的数据量都呈爆炸性增长趋势,数字音乐随处可见并且与日俱增。与此同时,各种音乐应用也极大促进了信息技术的前进步伐,例如音乐共享使得古老的对等技术在20世纪结束之际开始成为主流。作为一个新的研究领域,音乐数据管理与检索不论在理论研究还是现实应用中都有着广阔的前景。目前音乐管理与检索领域的研究成果远远不能满足现实中的应用需求。为此,本文以音乐数据为目标,采用数据管理与统计计算的技术路线,研究了音乐数据管理的理论、技术和方法,同时研究了对等网络中基于内容的音乐信息检索技术等,主要研究成果如下: 在音乐数据管理方面,提出了数据模型、查询语言、存储结构、存取方法、主题挖掘算法和查询处理方法。具体的,提出音乐数据模型,不仅能够有效表达音乐数据的各种复杂结构和语义,而且能够有效支持各种音乐计算应用。提出音乐数据定义和操纵语言MuSQL,直接支持各种音乐操作。提出结构化存储方法,灵活存储各种音乐数据。提出音乐数据上的N-gram倒排索引结构,具有简单方便、易于在数据库系统中实现等优点。提出中心、平凡和集簇摘要索引结构(abstract index, AbIx),具有空间消耗小、查询速度快、保证peer高度自治、支持高频更新等特点,还适合于音乐数据之外的其它媒体数据。提出音乐主题挖掘算法CDM,性能优于现有同类算法。提出音乐数据查询处理算法,以及该算法的NestedLoop和SortMerge两种实现。提出集中式、分布式和结构化对等数据系统中获取候选peer集合的算法,以及基于内容的近似查询处理方法,能够在各种对等数据系统中搜索尽量少的peer得到尽量多的满足用户查询的返回结果,此外还适用于Grid、Deep Web等其它分布式环境。 在音乐信息检索方面,提出并分析了对等网络环境下四种音乐信息检索模式和检索算法,同时给出PsPsC模式的实现方案。具体的,提出对等网络环境下基于内容的音乐信息检索问题,并给出基于内容音乐信息检索的4种peer-to-peer模式。通过从网络负载、检索时间、系统更新和鲁棒性等方面对4种模式进行了理论分析和实验比较,发现PsPsC模式是最适合近似查询的模式,PsC+模式是最适合精确查询的模式。提出PsPsC模式的实现方案,包括特征提取方法、检索算法、重复结果过滤方法以及体系结构等。模拟实验结果验证了所提算法的有效性。 最后使用上述基础研究成果,设计实现了音乐数据管理系统HIT-DML。它采用新颖的体系结构,完全以数据库系统为基础,把音乐的内容数据、特征数据和元数据结构化存储在数据库中;不仅在数据库系统内实现了若干音乐操作,例如特征提取,把多媒体技术和数据库技术无缝地结合在一起;而且充分利用数据库系统已有优点,例如事务处理等;同时能够根据乐器种类基于内容地检索和播放音乐。HIT-DML验证了本文提出的音乐数据管理与检索关键技术的理论及实际意义。