论文部分内容阅读
摘要 :教学质量是高等教育工作的重中之重,想要切实有效的提高高等教育的教学质量,必须从基础课教学质量抓起。本文探索了问答式教学方法及其在数据分析这门基础课程教学中的应用,取得了良好的效果,提升了学生对知识的获得感,受到学生好评。
关键词 :问答式教学 ;职业教育
中图分类号:G4 文献标识码:A
一、引言
在大量的数据中,发现不同商品之间有意义关联的分析应用,我们称为关联分析。例如我们在网上选购书籍时,在“加入购物车”下面,会给出“经常一起购买的商品”推荐。并且这些推荐的商品都是和我们选中的商品之间存在强关联性的。在关联分析中常用支持度、置信度和提升度来衡量商品之前的关联性强弱。
二、支持度
我们先来看一个问题:在10000个顾客中,同时购买{啤酒,面包}的顾客有100个,同时购买{啤酒,尿布}的顾客有800个。那么一个顾客会同时购买{啤酒,尿布}和会同时购买{啤酒,面包}的可能性分别是多少?
可以算出:一个顾客同时购买{啤酒,尿布}的可能性(概率)为:,一个顾客同时购买{啤酒,面包}的可能性(概率)为:
显然如果两个商品之间具有较强的关联性,那么意味着这两个商品被同时购买的可能性更大。所以啤酒与尿布之间的关联性强于啤酒与面包之间的关联性。而这里我们计算的概率就称为支持度。
支持度就是在所有项集中,项集{X,Y}同时出现的可能性,即项集中同时含有X和Y的概率。支持度衡量了所考察的关联规则在“量”上的多少。
三、置信度
我们做关联分析的目的是希望顾客在购买了一件商品A的同时,为他推荐一件因购买了商品A而很可能会一起购买的商品B。那么通过支持度筛选出来的关联规则一定能实现这个目的吗?对此我们再来看一个问题:
在10000个顾客中,购买了啤酒的顾客有8000个,购买了尿布的顾客有1000个,其中同时购买了{啤酒,尿布}的顾客有800个。那么购买了啤酒的顾客中,会同时购买尿布的概率是多少?购买了尿布的顾客中,会同时购买啤酒的概率又是多少?
和是两条关联规则的支持度都是8%。但是,购买了啤酒的顾客中,会同时购买尿布的概率是:,购买了尿布的顾客中,会同时购买啤酒的概率是:。
可见,虽然和都有着相同的支持度,但购买了啤酒的顾客会同时购买尿布的可能性要小很多,而购买了尿布的顾客更有可能会购买啤酒。所以我们可以看到和两条关联规则在反映商品间关联性上的意义是不一样的,并且是更有意义的规则。
这里我们计算的概率称为置信度,所谓置信度就是在关联规则中在X已经发生的条件下,Y发生的概率,即在含有X的项集中,同时含有Y的可能性。
四、提升度
针对上面的例子,我们再提出一个新的问题:在10000个顾客中,购买了啤酒的顾客有8000个,购买了尿布的顾客有1000个,其中同时购买了{啤酒,尿布}的顾客有800个。那么购买了尿布的顧客中,会同时购买啤酒的概率是多少?没有购买尿布的顾客中,会购买啤酒的概率是多少?
购买了尿布的顾客中,会同时购买啤酒的概率是:,没有购买尿布的顾客中,会购买啤酒的概率是:
可以看到,顾客买了尿布再买啤酒和没有买尿布但买了啤酒的概率是一样的,这说明了顾客是否买啤酒,与有没有买尿布之间是没有关联的,两者是相互独立的。这也说明虽然关联规则的置信度高达80%,但是这条关联规则其实也是没有意义的。
那么我们如何来弥补置信度的这一缺陷呢?显然,如果买了尿布再买啤酒的概率大于买啤酒的概率,那么就可以说明买了尿布的对购买啤酒是有促进作用的了,关联规则就是有意义的了。
所以,我们用。这一比值来衡量关联规则的可靠性,该比值称为提升度。提升度就是表示在X发生的条件下,Y发生的概率与Y总体发生的概率之比。
提升度反映了X的出现对Y的出现概率造成了多大的影响。当提升度为1时,表示尿布与啤酒是相互独立的,尿布的出现对啤酒是没有提升作用的;当提升度大于1时,表明提升度越大,尿布对啤酒销量的提升程度越大,他们之间的关联性越强。
重庆电子工程职业学院 重庆 401331
关键词 :问答式教学 ;职业教育
中图分类号:G4 文献标识码:A
一、引言
在大量的数据中,发现不同商品之间有意义关联的分析应用,我们称为关联分析。例如我们在网上选购书籍时,在“加入购物车”下面,会给出“经常一起购买的商品”推荐。并且这些推荐的商品都是和我们选中的商品之间存在强关联性的。在关联分析中常用支持度、置信度和提升度来衡量商品之前的关联性强弱。
二、支持度
我们先来看一个问题:在10000个顾客中,同时购买{啤酒,面包}的顾客有100个,同时购买{啤酒,尿布}的顾客有800个。那么一个顾客会同时购买{啤酒,尿布}和会同时购买{啤酒,面包}的可能性分别是多少?
可以算出:一个顾客同时购买{啤酒,尿布}的可能性(概率)为:,一个顾客同时购买{啤酒,面包}的可能性(概率)为:
显然如果两个商品之间具有较强的关联性,那么意味着这两个商品被同时购买的可能性更大。所以啤酒与尿布之间的关联性强于啤酒与面包之间的关联性。而这里我们计算的概率就称为支持度。
支持度就是在所有项集中,项集{X,Y}同时出现的可能性,即项集中同时含有X和Y的概率。支持度衡量了所考察的关联规则在“量”上的多少。
三、置信度
我们做关联分析的目的是希望顾客在购买了一件商品A的同时,为他推荐一件因购买了商品A而很可能会一起购买的商品B。那么通过支持度筛选出来的关联规则一定能实现这个目的吗?对此我们再来看一个问题:
在10000个顾客中,购买了啤酒的顾客有8000个,购买了尿布的顾客有1000个,其中同时购买了{啤酒,尿布}的顾客有800个。那么购买了啤酒的顾客中,会同时购买尿布的概率是多少?购买了尿布的顾客中,会同时购买啤酒的概率又是多少?
和是两条关联规则的支持度都是8%。但是,购买了啤酒的顾客中,会同时购买尿布的概率是:,购买了尿布的顾客中,会同时购买啤酒的概率是:。
可见,虽然和都有着相同的支持度,但购买了啤酒的顾客会同时购买尿布的可能性要小很多,而购买了尿布的顾客更有可能会购买啤酒。所以我们可以看到和两条关联规则在反映商品间关联性上的意义是不一样的,并且是更有意义的规则。
这里我们计算的概率称为置信度,所谓置信度就是在关联规则中在X已经发生的条件下,Y发生的概率,即在含有X的项集中,同时含有Y的可能性。
四、提升度
针对上面的例子,我们再提出一个新的问题:在10000个顾客中,购买了啤酒的顾客有8000个,购买了尿布的顾客有1000个,其中同时购买了{啤酒,尿布}的顾客有800个。那么购买了尿布的顧客中,会同时购买啤酒的概率是多少?没有购买尿布的顾客中,会购买啤酒的概率是多少?
购买了尿布的顾客中,会同时购买啤酒的概率是:,没有购买尿布的顾客中,会购买啤酒的概率是:
可以看到,顾客买了尿布再买啤酒和没有买尿布但买了啤酒的概率是一样的,这说明了顾客是否买啤酒,与有没有买尿布之间是没有关联的,两者是相互独立的。这也说明虽然关联规则的置信度高达80%,但是这条关联规则其实也是没有意义的。
那么我们如何来弥补置信度的这一缺陷呢?显然,如果买了尿布再买啤酒的概率大于买啤酒的概率,那么就可以说明买了尿布的对购买啤酒是有促进作用的了,关联规则就是有意义的了。
所以,我们用。这一比值来衡量关联规则的可靠性,该比值称为提升度。提升度就是表示在X发生的条件下,Y发生的概率与Y总体发生的概率之比。
提升度反映了X的出现对Y的出现概率造成了多大的影响。当提升度为1时,表示尿布与啤酒是相互独立的,尿布的出现对啤酒是没有提升作用的;当提升度大于1时,表明提升度越大,尿布对啤酒销量的提升程度越大,他们之间的关联性越强。
重庆电子工程职业学院 重庆 401331