【摘 要】
:
当今世界,互联网迅猛发展,信息无论从产生还是传播速度上,都大幅提升,在这样一个信息爆炸的时代,如何快速有效的从大量数据中获取感兴趣的信息,给搜索引擎的发展带来了巨大的
论文部分内容阅读
当今世界,互联网迅猛发展,信息无论从产生还是传播速度上,都大幅提升,在这样一个信息爆炸的时代,如何快速有效的从大量数据中获取感兴趣的信息,给搜索引擎的发展带来了巨大的挑战。微博作为近几年兴起的社交方式,渐渐走入每个人的生活,微博上的内容既包含权威的新闻事件,热点话题,也包含数以亿计的普通用户发布的生活娱乐内容。对于微博的检索一直是一个值得研究的热门话题。本文首先介绍了信息检索的相关技术,分析了 Learning to rank模型的优势以及信息检索系统的衡量标准。经过调研,本文从相关性和多样性两个方面优化微博检索结果。相关性方面,本文设计并实现了 GBDT模型训练非语义特征,再融合LTR模型的网络结构,同时引入神经网络训练的词向量作为特征。在推特数据集上,优化了 MAP和P@30两项指标。多样性方面,实现了将神经网络训练的句向量作为特征的k-means聚类。验证了句向量训练的有效性。另外,利用Simhash去重算法,去除近似重复的推特,取得了比聚类更优的F1值指标。本文的选题是基于2014年TREC微博检索评测任务,提出了新的思路和解决方法。最后,本文阐述了完成该任务时的设计与实现流程,并分析了评测结果。
其他文献
随着大数据时代的到来,网络在金融市场及交易投资决策中扮演着越来越重要的角色。互联网除了提供报刊、电视传统媒体的公开信息外,同时也伴随着各种私有、难以证实的传言等,更为重要的是为投资者提供了对这些信息进行收集、分析和消化的互动交流途径。面对信息量短时间内的爆炸性增长,个体对信息利用能力却很有限,因而必须能够在纷繁复杂的信息之间有所取舍。“百度指数”作为投资者关注的衡量指标,主要用于股票市场的收益率及
在中国实施“走出去”战略后,2015年“一带一路”战略的推动下,当前国内企业进行海外并购交易事件正井喷式的增长,而海外并购是目前企业实现规模扩大、资源获取、增强公司竞
图像超分辨率重建是数字图像处理领域中的一个重要研究方向之一,它能够有效地提升图像的清晰度和分辨率。图像超分辨率重建的应用领域非常广泛,如医学图像处理、监控、高清晰
高压输电线路距离长、跨度大、分布面积广,地理和气象条件都十分复杂,受雷击的几率高,雷击事件时有发生,因此雷击是造成高压输电线路停电事故的主要原因之一。若是能识别出故
目的:阐述调和肝脾法治疗类风湿关节炎(RA)的理论依据,观察和痹方(HBR)联合甲氨蝶呤(MTX)与艾拉莫德(T-614)治疗活动期RA的临床疗效及改善患者焦虑抑郁状态的情况,并从胆碱能抗炎通路(CAP)角度探讨和痹方治疗RA的作用机制。方法:临床研究:RA患者69例,以33例服用MTX+T-614的患者为对照组,以36例服用和痹方+MTX+T-614的患者为治疗组,疗程12周。观察临床疗效及改善
随着国际社会早产儿出生存活比例的不断攀升,早产儿作为一个特殊且高危的群体,其生存状态受到社会和医学的广泛关注。发达国家不仅重视早产儿救助更是重视其出院后管理。早产儿早期生长状态对其追赶生长至关重要,更直接影响到儿童成年生长、智能及健康情况。根据早产儿保健规范要求,对早产儿出院后定期随访,及时发现问题,早期解决问题,进行个性化指导干预,提高早产儿生活质量是儿童保健工作者迫在眉睫的任务。因此本研究对2
冷鲜猪肉营养丰富,深受消费者青睐,是猪肉生产和消费的主要产品和发展方向。微生物增殖及其导致的品质劣变是冷鲜猪肉腐败变质的主要原因,造成了较大的经济损失,甚至导致食品安全问题。在猪肉的加工、贮藏等过程中,控制合适的环境条件对于猪肉品质的维持至关重要。本研究通过探究不同贮藏环境条件下冷鲜猪肉中微生物生长规律及品质劣变规律,构建微生物生长预测模型及品质预测模型,进而构建货架期模型及品质预测体系,以期为冷
低温等离子体技术是一种绿色、清洁、无污染技术。低温等离子体引发的聚丙烯的熔融接枝改性,是一种更为绿色、高效的聚丙烯本体接枝改性方法,在开发性能优越、价格低廉、绿色环保的聚丙烯材料方面具有良好的可行性。本文采用介质阻挡放电装置,选用空气等离子体在常压下对iPP进行表面改性,在熔融条件下实现了聚丙烯与季戊四醇三丙烯酸酯酯(PETA)的接枝共聚,制备了iPP-g-PETA接枝共聚物。研究了不同实验条件对
在经济快速发展和现代消费升级的拉动下,人们开始追求生活方式与品位,对美好生活的向往是大势所趋,并且人们可持续发展意识日益提高,绿色消费、环保主张成为时代发展的主旋律