基于搜索引擎的词汇语义相似度计算方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:hongxingdehong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词汇语义相似度的计算在网页浏览和查询推荐等网络相关工作中起着重要的作用。传统的基于分类的方法不能处理持续出现的新词。由于网络数据中隐藏着大量的噪音和冗余,鲁棒性和准确性仍然是一个挑战,因此提出了一种基于搜索引擎的词汇语义相似度计算方法。语义片段和检索结果的页数被用来去除词汇语义相似度计算过程中的噪音和冗余。此外,还提出了一种方法来整合查询结果页数、语义片段和显示的搜索结果的数量,该方法不需要任何先验知识与本体。实验结果显示,所提出的方法在Rubenstein-Goodenough测试集的相关系数为0.851,优于现有的基于网络的词汇语义相似度计算方法,同时在搜索引擎的查询扩展任务中具有较为良好的应用效果。
其他文献
目的:调查唐山地区部分人群高尿酸血症和痛风的患病率,探讨高尿酸血症患病危险因素。方法:对2015年10月至2015年12月于唐山工人医院体检中心进行体检的人群进行研究。签署知
随着经济形势的好转,中小企业的订单数量稳步回升,用工短缺的问题也随之而来。本文总结了当前中小企业用工短缺的现状,从宏观层面和企业自身层面分析了中小企业用工短缺的原
本文综述了近十年来固相表面荧光光谱法、固相萃取-固相表面荧光联用技术以及流动注射分析、顺序注射分析和可更新表面技术与固相表面荧光联用技术在药物分析中的应用。展望
管理学是高等院校管理学科的专业基础课程。为培养创新型管理人才,必须对管理学课程的教学理念、方法和内容进行革新。本文提出应确立知识传授与应用实践并重的教学理念,倡导
保护证券市场投资者尤其是保护中小投资者,是各国政府证券市场监管的核心内容,也是证券市场健康运行的基础。国际上证券投资者保护已经有很长的历史,有很多经验值得我们借鉴
随着中央银行职能的调整变化,基层央行员工的思想观念、认知水平、价值取向都发生了重大的变化,对思想政治工作提出了新要求。本文在对人文关怀、心理疏导等新的理念认知和传
7月22日,钱江晚报《一只酥饼,两地暗战》的报道刊发后,引起了我市社会各界的关注:金华酥饼被龙游酥饼“打垮”了吗?金华酥饼的行业标准怎么会让龙游酥饼企业来制定?$$各界
报纸
目的:探讨微创经皮椎弓根螺钉内固定系统治疗无脊髓神经损伤胸腰椎骨折的效果。方法:对我科2013年3月至年月收治的无神经症状的胸腰椎骨折例,采用经皮后路椎弓根螺钉内固定治
<正>思维品质在学习过程中具体表现为一个人以辨析、分类、概括、推断、分析等方式展开思维并体现其在逻辑性、批判性、创造性等方面的水平和特点。培养思维品质是学习者心理
<正>1933年8月9日,在湖北武昌威泉台,中国工农红军第一位飞行员龙文光被国民党当局以“带机投匪”罪判处死刑。这位年仅34岁的飞行员在中国工农红军战史上,留下了光辉的一页