基于Lucene的个性化站内搜索引擎的研究

来源 :计算机应用与软件 | 被引量 : 6次 | 上传用户:bsky613
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出并实现一种基于Lucene的个性化站内搜索引擎的原型,根据注册用户的行业背景和计算相似用户兴趣预测来计算相关词的权重。在实际的应用中,比通用的搜索引擎更加适合具有行业背景稳定特点的企业注册用户。最后实验结果表明该方法对于用户的搜索提供了比通用搜索引擎(以Google为例)具有更高的匹配度和查准率。
其他文献
对Büchi自动机进行优化是提高基于自动机的模型检测效率的重要手段。对直接模拟关系、延迟模拟关系和公平模拟关系的概念,进行了比较,并探讨了基于这些模拟关系的自动机
阐述了网络地址转换NAT(Network Address Translator)的由来,以及VOIP应用中SIP穿越NAT难的问题。研究当前穿越NAT的众多方案,选择利用STUN穿越非对称NAT以及配合TURN来穿越对称NAT,从而实现穿越NAT的ICE方案。该方案无需对NAT和软交换设备做任何改动,而且比以前方案更具灵活性。测试结果表明,该方案成本低,具有一定的应用前景。
党报通讯员,有人形象地称为是各级党委和政府在宣传工作上的“传声筒”、“代言人”。党报通讯员在精确定位自己工作的同时,要提高自己的“上稿率”,就必须拥有大局观、创新观、
从节能减排的意义出发,简述了防腐保温工作的重要性。
采用模糊支持向量机时,隶属度函数的设计是整个算法的关键。详细阐述了已存在的隶属度函数,重点分析了目前应用较广的紧密度模糊支持向量机,针对紧密度模糊支持向量机的不足,提出了一种扩展的紧密度模糊支持向量机,并将其应用到文本分类领域。实验结果表明,与传统模糊支持向量机相比,该算法分类性能更好,抗噪能力更强。
提出两种基于矩阵分解的DLDA特征抽取算法。通过引入QR分解和谱分解(SF)两种矩阵分析方法,在DLDA鉴别准则下,对散布矩阵实现降维,从而得到描述人脸图像样本更有效和稳定的分类信息。该方法通过对两种矩阵分解过程的分析,证明在传统Fisher鉴别分析方法中,矩阵分解同样可以模拟PCA过程对样本进行降维,从而克服了小样本问题。在ORL人脸数据库上的实验结果验证了该算法的有效性。
食品质量安全是公共健康面临的主要威胁之一,国际社会对它的关注程度正逐步加强。通过分析食品质量安全追溯信息的组成,给出了食品质量安全追溯系统的框架结构、追溯码的设计方法和条形码标签的打印方法,并以农产品的质量安全追溯为例,设计了具有C/S与B/S混合结构的农产品质量安全追溯系统,并在.NET平台上开发实现了该系统。
从DBP增塑剂生产的酯化等工序剖析了基本工艺流程设计经验,力图在实际生产中科学操作,为基本工艺的优化和提高提出建议。
转录调控、转录翻译和信号传导网络等生化网络分别刻画不同的生物过程,描述细胞的不同生命活动。对这些生化网络进行计算机建模与分析,不仅可以获得细胞生长各阶段更加全面的认识,同时对药物靶点的确定和代谢工程的发展也有着深远的影响。基于约束的重构和分析方法COBRA是一套完整的对生化网络进行建模和分析的框架。它已被广泛应用于全基因组规模代谢网络的研究中,同时在应用过程中也发展出了许多极具价值的分析方法。近年