一种实体描述短文本相似度计算方法

来源 :智能计算机与应用 | 被引量 : 0次 | 上传用户:sophieyeah
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文实体描述短文本具有词语稀疏、语义离散、用词随意等特点。本文分析《知网》义原网络和词语相似度的关系,提出了短文本间语义相似度部分和短文本分类部分相结合的实体描述短文本间相似度计算方法。语义相似度部分分析《知网》义原网络和词语间相似度的关系,在计算词语间相似度和短文本间相似度的过程中弱化了浅层《知网》义原影响并均衡了义原权重,使义原相似度计算结果更加合理。短文本分类部分将短文本分解为义原向量,根据特定领域短文本的义原分布情况进行短文本分类。两部分结合得到实体描述短文本间相似度。本文方法的有效性在百度知识图谱数据分析竞赛任务1的测试结果中得到了证明。
其他文献
为分析不同浓度芘胁迫下植物根系分泌物的变化情况,进一步研究多环芳烃污染环境的植物修复机理提供科学理论和参考。选取栾树、樟树为试验对象,测定在不同芘浓度胁迫下(L0:0 m
近几年,经济高速发展,商品房的价格不断高攀,居民收入也呈大幅度增长的趋势.然而商品房价格已高的超出大部分人的负荷,贫富差距也日益拉大.因此,研究房地产价格波动和居民收
精神病患者可能出现饮食障碍,如精神症状引起的少食、拒食、饮食过量、异食等,患者服用精神药物后,也可出现某些副作用,如吞咽困难等,如处理不当,有可能会发生危险.对发生饮
据统计,约5%~10%烧伤患者并发吸入性肺损伤,重度死亡率可达80%以上,是早期烧伤患者主要的死因之一。虽然针对吸入性损伤的研究一直是国内外研究的热点,但其关键因素始终未能
<正>健康的党内政治文化,如同碧水蓝天的环境,让人能够"深呼吸"。然而,在个别单位,人与人相处却带有不少"俗气"。有的把处世原则等同于交易原则,你投之以桃,我报之以李;有的
期刊
“陌生化”这一理论由俄国形式主义理论家什克洛夫斯基在《作为技巧的艺术》中最先提出来,他认为在对文学艺术的欣赏中.那些太司空见惯、太熟悉、毫无新鲜感的事物不能唤起人们
欧洲安全与合作会议是缓和的最高潮,它十分清晰地反映出英国对缓和的态度及其政策特点:不想要,但不可避免。虽然英国并不想要欧安会,但是针对苏联的缓和政策,也为了在缓和潮
旅游景区的引资开发是各地目前正在尝试的一种做法,在这个过程中出现的一系列问题引发了笔者的思考,尝试从利益相关者管理的角度针对实际提出一些可行的策略。
本文介绍了BP人工神经网和MATLAB软件,并举例说明了MATLAB神经网络工具箱的用法。