论文部分内容阅读
摘要:本文从电子商务信息挖掘的角度来研究数据挖掘在电子商务中的商务应用。针对目前已有的一些WEB数据挖掘方法,作者将数据挖掘中的模糊关联规则应用到电子商务中的信任评价系统中去,并对这种方法的流程进行详细说明。
关键词:电子商务;数据挖掘;模糊关联规则;信任评价系统
1引言
电子商务中的信息挖掘一直是人们研究的热点。很多研究数据挖掘的学者纷纷将其研究的成果应用到实际当中,并作为市场预测、市场细分与分类、客户关系管理以及其他商务应用的参考模型。电子商务信息挖掘一般采用的是WEB数据挖掘中的一部分。例如,文献[1]就是利用SVM来进行电子商务中的应用挖掘——网络日志的分析,以提取客户分类及评分。
在电子商务环境中,一个电子商务支撑环境能够产生一个信任值,通过衡量已交付的服务质量以及从顾客和信任管理机构中获得的服务评价。没有任何信任管理机制,许多消费者也许会因为欺骗性的广告而请求了欺骗性的服务。另一方面,一个简单但是不完整的信任管理系统也许让服务提供商有选择性地欺骗顾客(例如,通过给许多低价的交易提供好的服务,但是在高价的交易中欺骗顾客来谋取大量的好处),以及欺骗信任管理机构(例如,通过在信任评价中合谋欺骗)。一些如此的欺骗可能导致服务质量降级,并且给客户带来经济损失。因此,电子商务行业必须有有效的信任管理[2]。
2关联规则的分类
关联规则的一个要求是结果得有透明度和可用性,这些结果是以产品群组规则的形式表示的,它表述了现实的产品和服务是如何组合到一起的。关联规则容易理解,但它们并不总是有用的。
有用的规则包含高质量、可操作的信息。平凡的结果早已被熟悉商业的任何一个人所知晓。平凡规则确实有一个用处,尽管它不是直接的数据挖掘应用。当一个规则应当在该时间100%出现,然后它却没有出现,这种情形可以提供关于数据质量的许多信息。换句话说,不遵循平凡规则的例外情况指出了商业运作、数据收集和处理等可能需要进一步改进的方面。费解的规则似乎没法解释,并且不给出行动过程。
当应用购物篮分析时,许多结果常常是平凡的或费解的。平凡规则再现商业常识,浪费了利用高级分析技术的努力。费解的规则是数据中的偶然事件,是不可操作的。[3]
关联规则有三个度量。支持度反映在交易数据中发现该规则的频繁程度,置信度说明当“如果”部分为真时“那么”部分也为真的频繁程度,而提升度反映该规则预测“那么”部分额相对根本没有规则要好多少。
这样生成的规则可以分成三类:有用的规则阐明可能没有预料到的关系,平凡规则阐明已知(或应该知道)存在的关系,费解的规则没有意义。费解规则常常有很弱的支持度。
3基于模糊关联规则的电子商务评价系统设计
3.1电子商务信任评价系统
一些著名的电子商务网站采用的是集中式信任管理机制[8]。在淘宝,每完成一笔交易之后,买家能够给一个反馈给系统,这个反馈是有关卖家的服务质量的,也许是良、中评或差评。淘宝服务器将这个评分存储在中心管理系统中。它用公式S=P-N来计算出这个反馈的分,其中P表示好评个数,N表示差评个数。淘宝网将这个S值显示在卖家的网页上。另一值R=(P – N)/(P + N)(1 ≥ R ≥ 0)是好评率。如果仅用好评率来作为信任评价的标准是不对的。通过模糊关联规则中,防止一些欺骗。例如,通过给许多低价的交易提供好的服务,但是在高价的交易中欺骗顾客来谋取大量的好处。
规则集相似度可以量化地表示当前的交易状态是否与正常的状态的相似程度,由此可以推断出此次交易的风险程度。并且可以根据其风险程度来进行报警或者提醒。
基于模糊关联规则的电子商务信任评价系统的流程如下图所示。
3.2模糊集和模糊隶属函数的建立
模糊集的建立实际上就是把数据集中的所有属性用模糊属性表示[4],每个模糊属性包含多个模糊值,每个模糊值有其对应的模糊集。模糊隶属函数用来描述一个确定属性值对于一个模糊属性集的隶属度。一个确定属性值可以隶属于多个模糊值,对应有多个隶属度。
如表1所示交易数据库T={t1,t2,t3,t4},属性I={num,money}(i1=num,i2=money)。
将每个属性又分别划分为若干个模糊集,对表1所示的数据库,在计算其各数据项隶属度之后数据库被转换为如表2所示。
4结束语
本文从电子商务信任管理中所发现的一些问题,结合现在数据挖掘在电子商务的应用,找到了一种基于模糊集的关联规则算法应用到电子商务信任评价中。在基于信誉的电子商务评价问题中,电子商务的评价往往是通过反馈的信息来完成,但是反馈回来的信息以及交易过程中本身所产生的信息要尽量将其中所隐含的信息挖掘出来,进行一定的分析,就可以得到一些有用的规则。而对于一些平凡的规则,也可以利用其来寻找其中的问题。这个系统还可以在进一步的进行扩展。例如,对规则集进行修正,去掉一些费解的规则,还可以去掉一些冗余的关联规则。这些都可以对整个流程有更好的改进。本文主要是对交易管理中的一些数据属性进行提取和发现规则。
参考文献:
[1] 过蓓蓓,方兆本.基于SVM的Web日志挖掘及潜在客户发现[J].管理工程学报,2010(1).
[2] Yan Wang and Kwei-Jay Lin.Reputation-Oriented Trustworthy Computing in E-Commerce Environments.
[3] Michael J.A.Berry,Gordon S.Linoff.别荣芳 尹静 邓六爱译.Data Mining Techniques:For Marketing,Sales,and Customer Relationship Management 数据挖掘技术:市场营销、销售与客户关系管理领域应用(原书第2版)[M].北京:机械工业出版社,2006.
[4] 王坤.模糊关联规则挖掘在入侵检测中的应用研究[D].西南交通大学,2006.
[5] 吴君辉,殷肖川,张薇.基于模糊关联规则挖掘改进算法的IDS研究[J].计算机测量与控制..2009.17(11)
[6] 邵峰晶,于忠清,著.数据挖掘原理与算法[M].北京:中国水利水电出版社,2003.
[7] Min Wu.Cloud Trust Model in E-Commerce[C].The Second International Symposium on Networking and Network Security(ISNNS 2010).JingGangShan.2010.4
关键词:电子商务;数据挖掘;模糊关联规则;信任评价系统
1引言
电子商务中的信息挖掘一直是人们研究的热点。很多研究数据挖掘的学者纷纷将其研究的成果应用到实际当中,并作为市场预测、市场细分与分类、客户关系管理以及其他商务应用的参考模型。电子商务信息挖掘一般采用的是WEB数据挖掘中的一部分。例如,文献[1]就是利用SVM来进行电子商务中的应用挖掘——网络日志的分析,以提取客户分类及评分。
在电子商务环境中,一个电子商务支撑环境能够产生一个信任值,通过衡量已交付的服务质量以及从顾客和信任管理机构中获得的服务评价。没有任何信任管理机制,许多消费者也许会因为欺骗性的广告而请求了欺骗性的服务。另一方面,一个简单但是不完整的信任管理系统也许让服务提供商有选择性地欺骗顾客(例如,通过给许多低价的交易提供好的服务,但是在高价的交易中欺骗顾客来谋取大量的好处),以及欺骗信任管理机构(例如,通过在信任评价中合谋欺骗)。一些如此的欺骗可能导致服务质量降级,并且给客户带来经济损失。因此,电子商务行业必须有有效的信任管理[2]。
2关联规则的分类
关联规则的一个要求是结果得有透明度和可用性,这些结果是以产品群组规则的形式表示的,它表述了现实的产品和服务是如何组合到一起的。关联规则容易理解,但它们并不总是有用的。
有用的规则包含高质量、可操作的信息。平凡的结果早已被熟悉商业的任何一个人所知晓。平凡规则确实有一个用处,尽管它不是直接的数据挖掘应用。当一个规则应当在该时间100%出现,然后它却没有出现,这种情形可以提供关于数据质量的许多信息。换句话说,不遵循平凡规则的例外情况指出了商业运作、数据收集和处理等可能需要进一步改进的方面。费解的规则似乎没法解释,并且不给出行动过程。
当应用购物篮分析时,许多结果常常是平凡的或费解的。平凡规则再现商业常识,浪费了利用高级分析技术的努力。费解的规则是数据中的偶然事件,是不可操作的。[3]
关联规则有三个度量。支持度反映在交易数据中发现该规则的频繁程度,置信度说明当“如果”部分为真时“那么”部分也为真的频繁程度,而提升度反映该规则预测“那么”部分额相对根本没有规则要好多少。
这样生成的规则可以分成三类:有用的规则阐明可能没有预料到的关系,平凡规则阐明已知(或应该知道)存在的关系,费解的规则没有意义。费解规则常常有很弱的支持度。
3基于模糊关联规则的电子商务评价系统设计
3.1电子商务信任评价系统
一些著名的电子商务网站采用的是集中式信任管理机制[8]。在淘宝,每完成一笔交易之后,买家能够给一个反馈给系统,这个反馈是有关卖家的服务质量的,也许是良、中评或差评。淘宝服务器将这个评分存储在中心管理系统中。它用公式S=P-N来计算出这个反馈的分,其中P表示好评个数,N表示差评个数。淘宝网将这个S值显示在卖家的网页上。另一值R=(P – N)/(P + N)(1 ≥ R ≥ 0)是好评率。如果仅用好评率来作为信任评价的标准是不对的。通过模糊关联规则中,防止一些欺骗。例如,通过给许多低价的交易提供好的服务,但是在高价的交易中欺骗顾客来谋取大量的好处。
规则集相似度可以量化地表示当前的交易状态是否与正常的状态的相似程度,由此可以推断出此次交易的风险程度。并且可以根据其风险程度来进行报警或者提醒。
基于模糊关联规则的电子商务信任评价系统的流程如下图所示。
3.2模糊集和模糊隶属函数的建立
模糊集的建立实际上就是把数据集中的所有属性用模糊属性表示[4],每个模糊属性包含多个模糊值,每个模糊值有其对应的模糊集。模糊隶属函数用来描述一个确定属性值对于一个模糊属性集的隶属度。一个确定属性值可以隶属于多个模糊值,对应有多个隶属度。
如表1所示交易数据库T={t1,t2,t3,t4},属性I={num,money}(i1=num,i2=money)。
将每个属性又分别划分为若干个模糊集,对表1所示的数据库,在计算其各数据项隶属度之后数据库被转换为如表2所示。
4结束语
本文从电子商务信任管理中所发现的一些问题,结合现在数据挖掘在电子商务的应用,找到了一种基于模糊集的关联规则算法应用到电子商务信任评价中。在基于信誉的电子商务评价问题中,电子商务的评价往往是通过反馈的信息来完成,但是反馈回来的信息以及交易过程中本身所产生的信息要尽量将其中所隐含的信息挖掘出来,进行一定的分析,就可以得到一些有用的规则。而对于一些平凡的规则,也可以利用其来寻找其中的问题。这个系统还可以在进一步的进行扩展。例如,对规则集进行修正,去掉一些费解的规则,还可以去掉一些冗余的关联规则。这些都可以对整个流程有更好的改进。本文主要是对交易管理中的一些数据属性进行提取和发现规则。
参考文献:
[1] 过蓓蓓,方兆本.基于SVM的Web日志挖掘及潜在客户发现[J].管理工程学报,2010(1).
[2] Yan Wang and Kwei-Jay Lin.Reputation-Oriented Trustworthy Computing in E-Commerce Environments.
[3] Michael J.A.Berry,Gordon S.Linoff.别荣芳 尹静 邓六爱译.Data Mining Techniques:For Marketing,Sales,and Customer Relationship Management 数据挖掘技术:市场营销、销售与客户关系管理领域应用(原书第2版)[M].北京:机械工业出版社,2006.
[4] 王坤.模糊关联规则挖掘在入侵检测中的应用研究[D].西南交通大学,2006.
[5] 吴君辉,殷肖川,张薇.基于模糊关联规则挖掘改进算法的IDS研究[J].计算机测量与控制..2009.17(11)
[6] 邵峰晶,于忠清,著.数据挖掘原理与算法[M].北京:中国水利水电出版社,2003.
[7] Min Wu.Cloud Trust Model in E-Commerce[C].The Second International Symposium on Networking and Network Security(ISNNS 2010).JingGangShan.2010.4