论文部分内容阅读
随着对等网络(P2P,Peer-to-Peer)规模和用户量的增加,P2P环境下的信息量也随之飞速增长,给用户在搜索、定位和获取信息资源上都带来了巨大的困难。对等网络信息搜索技术是解决这一问题的重要手段。较好的信息搜索技术不但能够提高搜索命中率,减轻节点负载,降低网络开销,还能够根据用户的兴趣提高搜索性能,主动学习,为用户的搜索节省时间,提高工作效率。可见P2P网络环境下的信息搜索技术,这一研究课题具有一定的应用价值。由于对等网络缺乏对网络中资源的整体把握,且多数搜索都是基于关键字的绝对匹配,因此节点用户需频繁更换关键字,才能够搜索到满意的结果,并且节点用户的搜索内容在一定程度上体现了该用户的兴趣。针对这一现象,论文提出了一种基于关键字关联和节点兴趣的P2P信息搜索机制。该机制注重关键字之间的关系的学习,注重通过用户操作发现节点的兴趣。在以后的搜索中,利用关键字的语义关系,增加命中目标,提高搜索成功率;根据节点的兴趣,缩小搜索范围,降低搜索开销。为了提高搜索性能,还采取了快速建立索引表的方法和反馈机制。最后用较好的实验结果证明了算法的有效性和高效性。利用关键字描述文件具有不准确性,因此基于关键字的P2P信息搜索限制了搜索性能。用户发出的搜索请求不能充分地反映其喜好特征,利用节点上的共享文件,更易发现该节点用户的兴趣所在。针对这两点,本文提出一种基于类簇的音乐内容搜索算法。利用音频特征抽取算法,进行短时傅立叶变换,得到信息熵、频谱中心、能量比等特征的统计值,组成特征向量。通过自适应的聚类算法对本地音频文件进行聚类,发送建类请求实现节点之间的兴趣聚类。详细阐述搜索策略,并提出改进搜索性能的动态CIT更新、类间节点优化和新节点启动优化等机制。最后用较好的实验结果和合理的性能比较证明了本搜索机制的实用性和准确性。