基于关联规则的六度分隔系统设计与实现

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:BarDy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以Blog(博客)、Tag(标签)、SNS(Social Networking Service,社会网络服务)、RSS(简易信息聚合)、Wiki(维客)等社会软件的应用为核心的Web2.0热潮在全球范围内愈演愈烈。在Web2.0的热潮中,SNS网站的发展潜力最受关注。SNS网站依据六度分隔理论建立,以认识的朋友(一度关系人)为基础,在已有朋友的基础上扩展自己的关系网(一至六度关系),从而得到强大而有效的社会资源。六度分隔系统是SNS网站上的一个应用,帮助用户在SNS网站的用户群中寻找、建立稳固的一至六度关系,使用户在六度关系之上进行广泛的社会及商业应用。由于SNS是新事物,目前国内外对六度关系的建立采取传统的关键字搜索,所建立的六度关系“脆弱”,不能体现SNS的个性化和社会化需求,使得六度关系在功能上不能发挥应有的强大作用。针对实际应用需求,本文将数据挖掘领域中最重要的两个技术:关联规则挖掘技术和分类技术,结合权重的思想,开创性地应用到SNS六度分隔的实现上来。这个系统工作在客户端,利用关联规则技术挖掘用户的潜在交友模式,综合使用“系统评级”和“个性化评级”对属性进行加权,提高了挖掘规则的准确性;使用了规则加权的分类技术对规则进行修剪。为用户提供了:1.带有权重的一度关系人,使六度关系更新建立在可靠的一度关系之上;2.根据不同分类规则对网站陌生用户进行分类,使用户可以基于这样的分类群发针对性的邮件,实现社会目的(交友)和商业目的(推广商品)。本文的主要研究工作和创新包括:1.在对用户基本信息的处理上,考虑到挖掘的完整性,提出了针对本系统特点的文本属性概化、数值属性聚类及关联度加权补齐空缺值的方法;2.在加权类关联规则的挖掘上,考虑到挖掘的准确性,使用“系统评级”和“个性化评级”综合反馈用户信息,提出属性加权的类关联规则挖掘算法,以提高类关联规则的精确性;3.在用户分类的实现上,使用加权分类技术对类关联规则进行加权修剪,改进了传统的CBA算法,创建针对个人用户的分类器,挖掘带有权重的一度关系人;4.运用以上技术设计并实现了基于关联规则的六度分隔系统。与传统的六度分隔系统相比,基于关联规则的六度分隔系统具有智能程度高和针对性强的特点,适应了用户个性化需求,有着很好的实际应用价值。
其他文献
随着计算机和网络的迅速发展,人们对身份认证技术提出了更高的要求,基于生物特征识别的智能身份认证方法也逐渐受到广泛的关注。在众多的生物识别技术中,指纹识别技术是发展最早
数字水准仪是集光学、电子、编码技术、图像处理、计算机技术于一体的当代先进的水准测量仪器。它凭借其速度快、精度高、操作简单等优点很快得到了广大用户的认可,并被应用于
随着计算机图形学与计算机网络技术的发展,越来越多的应用需要通过互联网、数字电视网络、甚至是无线网络,来访问那些存放在异地的三维几何图形数据。这使得本已经十分有限的网
随着信息系统与软件产品规模的急剧扩大,软件体系结构逐渐成为软件工程领域的热点及关键技术,日益受到国内外学术界和工业界的关注。软件体系结构关注系统的全局组织形式,是
层次型无线传感器网络是大量节点按簇结构呈层次性组织的一类传感器网络。提供安全的网内处理和被动参与功能以减少通信量是层次型无线传感器网络安全中的重点。由于传感器网
动态预测是实际工程领域和科学研究中普遍存在的问题。在应用中,很多系统都可以看作是一类复杂的非线性时变问题,一些问题由于缺乏先验理论和知识,以及内部变换和环境因素相
随着电子技术和通信技术的发展,一方面使路由器的性能越来越高,它不仅仅是进行简单的转发数据,而且还可以提供服务分类(CoS)功能;另一方面,SDH/SONET能够为节点之间的互联提
软件维护是软件投入使用后,对软件进行适应性、修正性、完善性、预防性维护的阶段,是整个生命周期中最漫长,时间成本最高的阶段。据报告,在整个软件维护过程中,程序理解的时
分布式计算的发展为大数据的分析和处理提供了一个新的平台。Map Reduce是一种能够在分布式系统中实现大规模数据并行运算的分布式计算框架。但是Map Reduce自身的不足限制了
实施客户关系管理对提高企业核心竞争力有着重要的作用,尤其是在专业为客户提供服务的客户服务中心,CRM系统的应用可以帮助提高企业工作效率,增加服务竞争力。随着客户服务中心C