论文部分内容阅读
摘 要:随着信息化技术的高速发展,电子商务已经逐渐成为当今最热门的商务模式之一,也逐渐的替代了大部分的传统商业模式,广大消费者也逐渐认可了这一新生事物。经过这些年的竞争,电子商务的市场集中度进一步的提高,资源逐渐掌握在少数几家手里,在某些方面已经近乎饱和,然而对于网上卖菜,各大电商虽有所涉猎,但都不是真正的核心,也没有什么亮点,对于网上卖菜这一方面真正做的好的并不是太多,为了方便广大消费者可以更快更方便的进行网上卖菜,决定开发网上蔬菜电子商务系统。
关键词:关联规则算法、网上蔬菜销售系统
一、前景分析
国家大力推进信息化建设以来,城乡网络应用水平得到了极大的完善和提升,致使Internet迅速崛起,电子商务的跨地域性和可交互性使其在与传统商店的竞争中具有极强的优势,因此很多人都看到了商机,使得电子商务的发展十分迅速。 经过这些年的竞争,电子商务的市场集中度进一步的提高,资源逐渐掌握在少数几家手里,在某些方面已经近乎饱和,然而对于网上卖菜,各大电商虽有所涉猎,但都不是真正的核心,也没有什么亮点,所以网上卖菜一直被电商看做是未来的一片蓝天。
二、系統功能介绍
网上蔬菜销售系统的开发目的是可以让消费者改变以往繁琐的买菜方式,也可以解决菜场买菜的弊端。通过对消费者进行问卷调查的方式大致了解了消费者的需求,并对网上蔬菜销售电子商务系统进行需求分析,通过对网上卖菜的实际情况的需求进行系统开发,符合消费者的需求,可以增大销售量。 本系统具有,基本要求WEB端信息管理、菜品信息管理、用户信息管理、购物车信息管理、订单信息管理、用户地址信息管理、食谱信息管理等。
三、关联规则算法简介
基于关联规则的推荐,是基于关联规则的基础上,将已购买的商品作为规则头,规则体则作作为推荐对象。关联规则挖掘可以在销售过程中发现不同商品之间的关系,已成功地应用于零售业。管理规则是一个交易数据库统计买什么比例的商品集X交易中交易的商品也买了套Y,当其直观含义是:用户在购买某些商品的时候有多大倾向去购买另外一些商品。基于该算法的一个生活例子,牛奶和面包,人们在购买牛奶的同时也会去选择购买面包。 在关联规则的基本算法方面,主要是Apriori算法。这是一个广度优先算法,频繁的支持大于一定阈值设置为通过扫描数据库的次数。它是频繁项的理论基础设置两单调原理:任何频繁项集的子集必须频繁;非频繁项集的超集一定是非频繁的任何。然后从这些频繁项集之间获得项目支持大于一定阈值的结果集,从而获得是否存在相关性之间的货物。
Apriori算法使用频繁项集的先验知识,使用一种称作逐层搜索的迭代方法,k项集用于探索(k+1)项集。首先,通过扫描事务(交易)记录,找出所有的频繁1项集,该集合记做L1,然后利用L1找频繁2项集的集合L2,L2找L3,如此下去,直到不能再找到任何频繁k项集。最后再在所有的频繁集中找出强规则,即产生用户感兴趣的关联规则。其中,Apriori算法具有这样一条性质:任一频繁项集的所有非空子集也必须是频繁的。因为假如P(I)< 最小支持度阈值,当有元素A添加到I中时,结果项集(A∩I)不可能比I出现次数更多。因此A∩I也不是频繁的。
四、实验分析和研究
本项目采取一个挖掘关联规则的算法—Apriori算法实现食品之间的相互关系。算法主要分为3个步骤来进行执行挖掘: 1)连接步骤:连接 ( k -1)- 频繁项集生成 k - 项候选集。可以连接的条件是 2 个 ( k -1) 项的前 ( k -2) 项相等并且第 1 个 ( k -1) 项集的第 ( k -1) 项比第 2 个 ( k -1) 项集的第 ( k -1) 项小。记 [ j ] 为 中的第 j 个项,则条件即为 [1]= [1] ? [2]= [2] ?…? [ k -2]= [ k -2] ? [ k -1]< [ k -1],其中, [ k -1]< [k -1] 可以确保不产生重复的 k - 项集。 2)剪枝步 Ck中的成员不一定都是频繁的,但所有的频繁项都包含在Ck中。因为任何非频繁的(k-1)项子集都不可能是频繁k项集的子集。因此,如果一个候选k项集的(1(.1)项子集不在Lk.1中,则该候选项集也不可能是频繁的,可以从Ck中删除。 3)扫描数据库 扫描数据库,将Ck中的每一项出现的次数累计起来。若某条记录包含了该候选项,那么该候选项的支持度计数就加l,最后通过比较其支持度和最小支持度来确定该候选项是否为频繁项。 删除步骤:利用 Apriori 性质对 k - 项候选集进行剪枝。剪枝的规则是:若一个 k - 项候选集的任一子集 (( k -1)- 项集 ) 不属于 ( k -1)- 项频繁集 L ,那么该候选 k - 项集就不可能成为一个频繁 k - 项集,可以将其删除。
步骤如下:扫描交易数据库,累加 k - 项候选集在交易数据库中出现的次数。对于一条交易记录和一个候选项集,若交易记录包含该候选项集,则该候选项集出现的次数就加1个I。最后根据给定的最小支持度阈值生成 k - 项频繁集。
五、结论
本文介绍了我国互联网的现状,电子商务的发展,分析了网上蔬菜销售电子商务过 程中面临的主要问题,对基于关联规则推荐算法的个性化商品推荐进行了有益的探 索和研究。本文首先分析了电子商务的业务流程,根据客户角色展开功能分析,识别出了商品展示、购物车管理、订单管理、客户反馈等业务功 能模块,并基于此展开用例分析,撰写了用例规约,对用例进行归整,提出了系统的逻辑架构。接着对关联规则算法进行了详细的建模,提出了客户-商品倒 排表、商品相似度、用户兴趣度等概念,并对具体的功能模块进行详细设计与 实现,给出了系统运行的程序界面。后,对系统运行中的用户行为数据进行分析,结合核心算法的关键代码,对个性化商品推荐的数据进行了分析。
参考文献:
[1] 张红艳,都娟. 关联规则中Apriori算法的应用[J].数字技术与应用, 2011(8): 45-46 [2] 赵洪英,蔡乐才,李先杰. 关联规则挖掘的Apriori算法综述. 四川理工学院学报(自然科学版) 2011(1): 56-58
作者简介:
董文杭(1992.10-),男,汉族,浙江温州人,本科学生,研究方向:手机及网络系统开发与应用
张琪(1972.9-),男,汉族,江苏南京人,硕士,副教授,研究方向:物联网及其应用技术等;
关键词:关联规则算法、网上蔬菜销售系统
一、前景分析
国家大力推进信息化建设以来,城乡网络应用水平得到了极大的完善和提升,致使Internet迅速崛起,电子商务的跨地域性和可交互性使其在与传统商店的竞争中具有极强的优势,因此很多人都看到了商机,使得电子商务的发展十分迅速。 经过这些年的竞争,电子商务的市场集中度进一步的提高,资源逐渐掌握在少数几家手里,在某些方面已经近乎饱和,然而对于网上卖菜,各大电商虽有所涉猎,但都不是真正的核心,也没有什么亮点,所以网上卖菜一直被电商看做是未来的一片蓝天。
二、系統功能介绍
网上蔬菜销售系统的开发目的是可以让消费者改变以往繁琐的买菜方式,也可以解决菜场买菜的弊端。通过对消费者进行问卷调查的方式大致了解了消费者的需求,并对网上蔬菜销售电子商务系统进行需求分析,通过对网上卖菜的实际情况的需求进行系统开发,符合消费者的需求,可以增大销售量。 本系统具有,基本要求WEB端信息管理、菜品信息管理、用户信息管理、购物车信息管理、订单信息管理、用户地址信息管理、食谱信息管理等。
三、关联规则算法简介
基于关联规则的推荐,是基于关联规则的基础上,将已购买的商品作为规则头,规则体则作作为推荐对象。关联规则挖掘可以在销售过程中发现不同商品之间的关系,已成功地应用于零售业。管理规则是一个交易数据库统计买什么比例的商品集X交易中交易的商品也买了套Y,当其直观含义是:用户在购买某些商品的时候有多大倾向去购买另外一些商品。基于该算法的一个生活例子,牛奶和面包,人们在购买牛奶的同时也会去选择购买面包。 在关联规则的基本算法方面,主要是Apriori算法。这是一个广度优先算法,频繁的支持大于一定阈值设置为通过扫描数据库的次数。它是频繁项的理论基础设置两单调原理:任何频繁项集的子集必须频繁;非频繁项集的超集一定是非频繁的任何。然后从这些频繁项集之间获得项目支持大于一定阈值的结果集,从而获得是否存在相关性之间的货物。
Apriori算法使用频繁项集的先验知识,使用一种称作逐层搜索的迭代方法,k项集用于探索(k+1)项集。首先,通过扫描事务(交易)记录,找出所有的频繁1项集,该集合记做L1,然后利用L1找频繁2项集的集合L2,L2找L3,如此下去,直到不能再找到任何频繁k项集。最后再在所有的频繁集中找出强规则,即产生用户感兴趣的关联规则。其中,Apriori算法具有这样一条性质:任一频繁项集的所有非空子集也必须是频繁的。因为假如P(I)< 最小支持度阈值,当有元素A添加到I中时,结果项集(A∩I)不可能比I出现次数更多。因此A∩I也不是频繁的。
四、实验分析和研究
本项目采取一个挖掘关联规则的算法—Apriori算法实现食品之间的相互关系。算法主要分为3个步骤来进行执行挖掘: 1)连接步骤:连接 ( k -1)- 频繁项集生成 k - 项候选集。可以连接的条件是 2 个 ( k -1) 项的前 ( k -2) 项相等并且第 1 个 ( k -1) 项集的第 ( k -1) 项比第 2 个 ( k -1) 项集的第 ( k -1) 项小。记 [ j ] 为 中的第 j 个项,则条件即为 [1]= [1] ? [2]= [2] ?…? [ k -2]= [ k -2] ? [ k -1]< [ k -1],其中, [ k -1]< [k -1] 可以确保不产生重复的 k - 项集。 2)剪枝步 Ck中的成员不一定都是频繁的,但所有的频繁项都包含在Ck中。因为任何非频繁的(k-1)项子集都不可能是频繁k项集的子集。因此,如果一个候选k项集的(1(.1)项子集不在Lk.1中,则该候选项集也不可能是频繁的,可以从Ck中删除。 3)扫描数据库 扫描数据库,将Ck中的每一项出现的次数累计起来。若某条记录包含了该候选项,那么该候选项的支持度计数就加l,最后通过比较其支持度和最小支持度来确定该候选项是否为频繁项。 删除步骤:利用 Apriori 性质对 k - 项候选集进行剪枝。剪枝的规则是:若一个 k - 项候选集的任一子集 (( k -1)- 项集 ) 不属于 ( k -1)- 项频繁集 L ,那么该候选 k - 项集就不可能成为一个频繁 k - 项集,可以将其删除。
步骤如下:扫描交易数据库,累加 k - 项候选集在交易数据库中出现的次数。对于一条交易记录和一个候选项集,若交易记录包含该候选项集,则该候选项集出现的次数就加1个I。最后根据给定的最小支持度阈值生成 k - 项频繁集。
五、结论
本文介绍了我国互联网的现状,电子商务的发展,分析了网上蔬菜销售电子商务过 程中面临的主要问题,对基于关联规则推荐算法的个性化商品推荐进行了有益的探 索和研究。本文首先分析了电子商务的业务流程,根据客户角色展开功能分析,识别出了商品展示、购物车管理、订单管理、客户反馈等业务功 能模块,并基于此展开用例分析,撰写了用例规约,对用例进行归整,提出了系统的逻辑架构。接着对关联规则算法进行了详细的建模,提出了客户-商品倒 排表、商品相似度、用户兴趣度等概念,并对具体的功能模块进行详细设计与 实现,给出了系统运行的程序界面。后,对系统运行中的用户行为数据进行分析,结合核心算法的关键代码,对个性化商品推荐的数据进行了分析。
参考文献:
[1] 张红艳,都娟. 关联规则中Apriori算法的应用[J].数字技术与应用, 2011(8): 45-46 [2] 赵洪英,蔡乐才,李先杰. 关联规则挖掘的Apriori算法综述. 四川理工学院学报(自然科学版) 2011(1): 56-58
作者简介:
董文杭(1992.10-),男,汉族,浙江温州人,本科学生,研究方向:手机及网络系统开发与应用
张琪(1972.9-),男,汉族,江苏南京人,硕士,副教授,研究方向:物联网及其应用技术等;