基于角相似性的k最近邻搜索研究

来源 :情报学报 | 被引量 : 0次 | 上传用户:xiaoyixay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在高维空间中k最近邻搜索(KNNS)应用非常广泛,但是目前很多KNNS算法都根据欧氏距离对数据进行索引和搜索,不适合采用角相似性的应用。本文提出一种基于角相似性的k最近邻搜索算法(AS—KNNS)。该算法先提出基于角相似性的数据索引结构(AS-Index),参照一条中心线和一条参照线,将数据以系列壳.超圆锥体方式进行组织并分别线性存储;然后确定查询对象的空间位置,有效确定一个以从原点到查询对象的直线为中心线的超圆锥体并在其中进行搜索。实验结果表明,AS-KNNS算法较其他k最近邻搜索算法有更好的性能。
其他文献
本文基于竞争情报领域研究生教育培养视角,从学科体系、学科在国内外的发展、社会对学科的人才需求、独立设置二级学科的必要性和可行性、设置二级学科后的发展前景5个方面,论
从Egghe-Rousseau模型和Glanzel-Schubert模型出发,推演出h指数与总被引次数C之间的幂函数关系模型(即h-C幂律关系模型),此模型与之前的实证结果相符。模型中幂指数最大值为0.5
本文提出一种面向聚类主题的文本特征表示方法,即以聚类的主题概念来刻画文本的特征向量,将文本描述提升至语义层次。首先,通过聚类,形成一组以向量形式表达的隐含主题概念,
词义消歧是一个分类过程,局部上下文是主要的分类特征。对称窗口指上下文边界与歧义词的左右距离相等,大部分消歧系统凭经验将其作为最优的局部上下文窗口,很少选择非对称窗口。
互联网已经成为企业和组织获取竞争对手情报的主要来源之一。建立基于Web的竞争对手情报自动获取系统已成为企业的迫切需求。在竞争对手情报自动获取系统中,商业机构名的识别