面向企业的行业微博信息推荐关键技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:OPOPO11211
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0的快速发展,社交网络已经成为网民上网所花时间最多的应用类型,随之催生了一种新型的营销方式,社交媒体营销。如今,社交媒体营销对于企业的重要性越来越突显出来,特别对于中小企业,社交媒体营销低成本和高回报的特点尤其具有吸引力。另一方面,门户中间件作为管理、运行和维护企业信息门户的支撑系统,近年来,其对于社交特性的集成越来越受到企业的看重。以企业门户为平台的社交媒体营销辅助工具,也是近年来各大门户厂商力推的主要功能之一。而微博作为时下最为流行的社交网络,以其独特的信息单元格式和信息传播方式成为了非常适合社交媒体营销的平台。   虽然社交媒体营销具有低成本、高回报的优势,但是企业想要最大限度地利用社交媒体营销手段还面临一些困难。其中之一便是微博平台的信息过载问题,表现为微博的主题分散性使得企业所订阅的微博中混杂着大量行业无关信息,使得营销人员获取行业信息的效率下降;另一方面,企业从大量的微博信息中快速准确地挖掘出行业相关信息,能够帮助其对行业动态做出及时的反应。   针对以上问题,本文提出一种基于关键词的行业信息个性化推荐方法以帮助用户快速准确地获得行业相关信息。该方法包含了一整套行业微博推荐的流程,包括数据的获取与预处理、基于图的关键词提取、基于共现的用户自定义关键词扩展、向量合并以及相关度计算和微博推荐。其中的用户兴趣建模方面,本方法基于用户的历史微博,提出了关键词提取与关键词扩展相结合来建模用户兴趣的方法,这种方法既保证了行业信息的全面识别又使得用户能够根据需求动态调整自己的行业兴趣。关键词提取方面,本文在比较了三种常用的关键词提取算法在本场景的提取结果后,采用了基于图的关键词提取算法TextRank,原因是该算法不依赖于其他语料,而且避免了提取结果受语言模型中存在的齐夫定律现象的影响。关键词扩展方面,本文借鉴了一种话题标签扩展算法的思想,对其依照本场景进行了修改,提出了P-IOW算法。通过关键词扩展,方法保证了用户的动态兴趣需求能够实时得到满足并且极大增强了用户自定义关键词的表述能力。兴趣建模结束后,关键词提取与扩展的结果将根据用户自定义权重进行线性合并。最后,据此合并向量利用向量空间点乘的方法对用户订阅微博进行相关度计算,据相关度大小排序为用户推荐相关微博信息。   本方法在新浪微博平台上以若干具有代表性的企业微博数据进行了实验并基于新浪微博开放平台实现了原型系统,证明了方法的有效性。
其他文献
聚类分析是数据挖据领域重要的基础性研究问题之一,而非负矩阵分解是一种重要的聚类分析方法。实际数据往往存在质量问题,如误差、噪声、异常点等,导致非负矩阵分解难以全面准确
XML是一种半结构化数据交换的标准格式,它已被广泛应用到Web服务、数据库以及形式化研究等等。为了更好的XML处理编程,近年来,在XML处理上出现了不少静态类型化函数式语言,比如XD
近年来,我国高速铁路建设与运营取得了快速发展,乘坐高速列车成为旅客长距离旅行的重要出行方式。在乘坐高速列车过程中旅客对于高质量的通信和数字娱乐服务的需求日益迫切,然而
随着计算机技术和网络通信的飞速发展,卫星网络在现代远程通信中占据越来越重要的地位。宽带卫星网络是一种新兴的通信方式,它具有高带宽、覆盖范围大的特点,特别适合进行组播通
随着人机交互技术与计算机视觉技术的不断发展,基于视觉的人机交互已经成为现在人机交互领域的一个重要发展方向。其中,手势交互作为一种直观的人机交互模式,具有符合人的生活习
宇航产品是典型的复杂产品,其结构复杂、质量和可靠性要求高。在其制造过程中,工艺复杂、知识密集,需要有效重用宇航产品制造过程相关知识,提升工艺设计的效率。然而,在宇航产品工
一幅自然图像中往往同时包含着结构和纹理。图像平滑时希望去掉图像中的纹理,同时保留图像中的结构。已经出现了许多优秀的图像平滑算法,其中一些算法基于图像中像素的亮度或者
探空火箭发射后,通过数传系统地面接收到大量的试验数据,它们具有巨大的科学研究和应用分析价值。本文的目的是设计有效组织管理数据、为数据提供统一回放平台的方法,以方便利用
随着科技的飞速发展,计算机技术已经被应用到社会生活的各个领域。教育作为科教兴国战略的核心内容,是现代社会生活的重要组成部分,同样受到计算机技术的深刻影响。数据结构课程
长期以来,软件开发过程都是基于文件系统构建起来的,在基于文件系统的软件开发方式下,代码、代码相关信息、文档都是以文件形式存储,软件开发活动都是围绕源代码、文档、可执行程