基于APP数据的标签提取与整合

来源 :浙江大学 | 被引量 : 0次 | 上传用户:zhenhua212824
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年随着移动互联网的高速发展,手机上的应用程序(APP)呈现出爆炸式增长,如何帮助用户在海量的APP中找到合适的APP是各下载平台急需解决的问题。传统热门排序的方法缺点十分明显,热门的APP竞争有限的曝光位置,大量长尾的APP得不到出场机会,这十分不利于APP生态圈的构建。标签体系是Web2.0时代解决资源对象长尾、帮助用户管理、检索资源对象的有效方式。在APP领域鲜有标签体系的研究,APPStore、Google Play等国外代表性APP下载平台也尚无标签功能,但未来随着APP数量继续爆炸式增长,通过标签体系来解决APP长尾问题势在必行。本文致力于对这一全新领域进行探索,研究如何高效、自动、准确地构建APP领域标签体系,具体包括四方面工作:·数据预处理工作:针对APP数据专门进行了新词发现、停用词表构建,在360APP数据集上实验表明,预处理工作可以显著改善标签质量。·标签提取工作:归纳总结了常用的关键词提取、标签推荐算法,根据APP数据存在多维度文本的特点,改进提出了三种有效的标签提取算法(SemanticRank、RankScore1、RankScOre2算法),更加适应APP数据集特点,得到较优的标签结果。·标签整合工作:借鉴知识图谱思想,引入多个外部数据源构建同义词关系、偏序关系整合标签,大幅提高了APP覆盖率、召回率,解决了标签杂乱、不规范的问题。另外,本文提出APP标签树的方法管理APP标签,使得APP标签多维度问题得到有效解决。·标签管理系统工作:实现了APP标签管理系统,系统融入了预处理、标签提取、标签整合相关成果,并提供友好的交互界面和可视化界面,方便标签管理人员维护、管理标签。
其他文献
信息化建设为人们的生产和生活提供了一种高效的途径,尤其体现在它可以通过建立丰富的业务程序帮助人们快速的处理繁琐的统计与分析工作。然而在许多应用领域,系统不得不面向多
随着计算机科学技术的迅猛发展,基于网络的远程教育日益受到重视,各种类型的在线考试系统、学习系统等相继涌出。测评作为计算机辅助教学平台的重要环节,同时对教与学起着重
对煤矿事故的预警是煤矿安全的一项重要的工作,目前对各类煤矿事故的预警基本上都是通过监测某单一因素是否达到临界值进行预警的,而当单一因素没有达到临界值,此时系统一般不预
虚拟现实技术旨在高度模拟现实世界环境,让用户与虚拟环境交互,给人身临其境的感觉,它的两个重要特征是交互性和沉浸感。而手作为人与虚拟现实环境交互时的重要工具,逼真的手
从文本挖掘的角度来看,文本的语义既可归结为单一的综合性语义表达,也可细分为多个主题的组合表达。当前的文本可视分析技术表达文本信息的角度或基于文本的单一综合性的语义
大数据发展时代,数据的量级在不断增加,人们每天都产生并需要处理大量的数据。人类天生对于图表形式的信息具有更好的接收效果,所以对于信息可视化的研究在当今时代之下也是如火
基于多协议标签交换的流量工程MPLS TE(Multi-Protocol LabelSwitch-based Traffic engineering)是当前Internet核心网采用的主流流量工程实施技术,它能够减少拥塞、保证IP网络
自然场景的真实感绘制一直是计算机图形学研究的热点问题,海场景的真实感绘制是其中比较热门的问题之一,而且海场景的绘制在众多领域也有着广泛的应用。传统方法已无法满足海
近年来,卫星通信技术的发展速度突飞猛进,应用范围也越来越广泛。随着卫星通信与互联网多业务结合的不断深入,人们对卫星通信在带传输带宽、多媒体数据、交互式应用等方面提
随着互联网行业如火如荼的发展,WWW信息资源得到蓬勃的增长,近年来人们越来越关注搜索引擎的研究工作,传统的基于关键字的搜索策略在目前已经发展得相当成熟,为了适应WWW飞速发展