专业人才跨域搜索研究与应用

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:liongliong480
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展和普及,网络招聘越来越成为主流,对关于各专业技能人才搜索的垂直搜索引擎的研究十分有必要。但是随着各大招聘网站和技术论坛用户的快速增长,不用来源的简历数据或论坛用户的重复率越来越高,对这些不同领域用户的相互关联很有意义,因为它不仅可以简化招聘工作,还能对用户的个人信息进行完善。对于简历之间的相互关联,本文首先对简历集进行了分类,然后对简历之间各字段的相似度进行比较;而对于不同论坛用户之间的关联,可转化为多重网络之间的节点匹配问题,目前,该问题主要是根据网络的结构信息,利用不同网络节点连接的相同的已知匹配节点对的个数来求得不同网络节点对之间的初始相似度,然后就可以将该问题转化为图论中的带权二分图匹配的问题,最后利用KM算法即可对其最优匹配进行求解。本文根据现有数据的特点,在该匹配算法的基础上,对其节点对之间的初始相似度计算方法进行改进。主要是因为现有的数据不止有双层网络之间的结构关系,而且各网络节点(即用户)还有很多属性信息,例如发帖记录和标签等,利用这些属性信息可以对用户对之间的相似度计算进行优化。同时本文还通过缓存措施对搜索引擎过程中的索引建立速度进行了优化、通过技能同义词库对搜索进行了模糊搜索的优化并结合实际情况对搜索出的结果进行了排序,使得结果更符合人们的直观需要。最后通过对搜索结果进行分析,说明了改进后的搜索方式更能丰富用户搜索结果;改进后排序方式能使得更符合用户预期的人物排在前面;通过对选取的知乎和微博网络结构数据进行匹配并和原算法比较结果,体现了节点对间初始相似度计算的改进对匹配结果的优化。
其他文献
在现代科技飞速发展的今天,人工智能作为一门新兴的前沿学科问世以来,已经取得了许多引人瞩目的成就。而作为人工智能研究分支领域机器学习、模式识别、机器人学交叉涉及的人
网络缓存技术认为是提高网络服务质量QoS(Quality of Service)的有效手段之一,它能降低Internet流量、提高终端用户的响应时间、减少网络的延迟。网络缓存技术是通过在现有网
随着Internet技术的快速发展,特别是Web2.0应用的普及,数据量开始爆炸性的增长,云存储虽然能有效解决传统文件系统处理大数据时在容量和性能上遇到的瓶颈,但也容易出现数据不
在当今经济全球化趋势下,采购对于保持企业的核心竞争力起着相当重要的作用,并且采购部门极有可能成为未来的“利润创造源”。因此,为了降低成本,增加利润以及提高市场竞争力,企业
CTR媒介智讯的最新研究显示,2014上半年,中国广告市场增长4.1%,户外视频媒体、互联网对整体市场的拉动作用更为明显。传统广告市场增长0.9%,一季度持续低迷,在4月和5月略微上扬后,6月份又转而下探。  媒体投放情况  电视媒体2014年上半年广告花费增长放缓,仅为2%。从各级别电视广告刊例花费增幅及时长的同比变化来看,电视再次进入资源调整期。中央台广告时长调整明显,刊例花费随之受到影响,降
测试是提高当代软件质量的有效手段和必要环节。为适应XML查询引擎的性能测试需求,配合达梦数据库XQuery引擎的开发与改进,需要研究相应的测试理论与方法,包括测试方案设计、
脑力劳动的主要特点之一是推理功能。计算机产生智能行为的关键之一,在于实现自动推理。我国在自动推理尤其是初中几何的自动推理领域取得了卓越的成就。本文拟利用CBR技术实
随着软件行业的发展,对健壮的和高性能的分布式计算系统的需求一直在稳定地增长。ACE(Adaptive Communication Environment)是综合应用了各种软件设计模式以及组件技术而形成
无线传感器网络是结合了计算、通信和传感三项技术,由大量传感器节点通过无线自组织的方式构成的网络;经过数十年的发展,已经成为目前计算机领域的研究热点之一。然而,由于无