基于文本挖掘的用户画像研究

来源 :汕头大学 | 被引量 : 0次 | 上传用户:kenmaxabc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展与日益普及,网络营销的价值也逐渐得到重视与认可,因此电子商务得到迅猛发展,而电子商务网站也日益成为大多数人生活中的“必需品”。而且越来越多的商家也希望借助电子商务在互联网销售市场的激烈竞争中立于不败之地。电子商务的不断发展,用户行为的研究是影响其生存发展的重要因素,用户行为研究的好坏成了决定消费者去留的关键原因。随着互联网用户规模及电子商务市场的不断扩大,电子商务市场的竞争愈发激烈,把握企业的竞争优势,同时加强企业战略性分化发展的能力,保证企业的可持续性发展是所有电子商务企业的共同目标。电子商务企业为了优化在网站上的营销活动和网站运营开销,都要投入大量的资源进行网站用户行为分析。随着产业的迅速发展,电子商务企业需要采用更先进的手段对网站进行网站用户行为分析,并构建自己的用户画像,并且大多电子商务网站已经积累了足够多的用户消费行为信息来进行用户细分等相关分析。  因此,本文通过对我国主流电子商务网站的数据进行相关采集与研究,并提出了用户画像构建的研究策略,并提出将用户属性分为基础属性标签,行为属性标签,价值属性标签,社交属性标签。并采用概率与信息熵的方法对用户数据进行分词,采用层次分析法对用户价值属性进行分析,得到用户的价值属性标签,并通过定义相关的规则,以此来构建用户画像,并采用k-means对构建的用户画像进行聚类。
其他文献
IP存储是当前信息技术领域中一个热门的研究方向。iSCSI技术是IP存储的底层存储协议,它的目的是在TCP/IP网络上实现SCSI传输协议。RAID(磁盘阵列)存储系统是构建大型存储系统
由于MAS运行的环境多是动态的、开放的、复杂的和分布的,不同的AOSE侧重的开发环境不同,因此在开发MAS中使用的模型和过程也不尽相同,这在一定程度上阻碍了AOSE的发展进程。本文
随着高技术武器的飞速发展,如何精确快速定位战场重要目标成为军事家所关心的一个重要问题。日益增多的遥感图像为此提供了一种方便简洁的途径,本文从战场空间信息的快速更新需求出发,对基于遥感影像配准的建筑物高程自动获取以及基于遥感影像控制点匹配的战场目标快速定位进行了研究,其主要工作如下:1.研究了遥感影像几何纠正和影像配准的基本原理、方法、过程和主要问题;2.改进了摄影测量的铅垂线轨迹(VLL)法,并利
随着互联网的飞速发展,网络安全问题也日益严重。入侵检测技术是继传统安全保护措施之后出现的一种积极主动防御的新一代安全保障技术,而Snort是其中基于规则匹配的一种入侵检
北京谱仪Ⅲ(BESⅢ)高能物理实验每年产生PB量级的实验数据,实验人员需要对海量数据进行处理和分析。为此,BESⅢ实验于2011年开始联合多个合作单位构建统一的分布式计算平台,以应
生物地理学优化算法(Biogeography-Based Optimizer, BBO)是在研究生物种群生存、繁衍、衰落和灭绝规律的基础上,通过模拟种群活动构造出的一种新型智能优化算法。BBO算法由于
随着高清电视和高清视频节目的发展,传统的DVD已经无法满足高清视频节目的需要。为了满足高清视频节目播放的需求,国外提出了两种蓝光高清标准,即HD-DVD和BLU-RAY DISC,但是
学位
入侵检测是用来检测和识别对计算机系统和网络系统,或者更广泛意义上的信息系统的非法攻击,或者违反安全策略事件的过程。它从计算机系统或网络环境中采集数据、分析数据、发现
信道编码常用于容易发生干扰的无线信道和存储信道中,随着VLSI技术的发展,采用ASIC或FPGA技术来实现信道编码器应用广泛。本文实现了一种基于SOPC技术的通用编译码器实验装置,此