多种数据挖掘技术对于电子商务分类问题研究

被引量 : 0次 | 上传用户:Jany9538235
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
电子商务行业竞争激烈,数据的价值正日益受到市场的重视。然而,相关统计工具仅提供统计信息、统计模型和假设检验结论,仍缺乏对数据空间的细节认知。而数据挖掘技术正是从数据空间和信息论的角度对数据进行分析,给出宏观与微观的数据结构特征,并利用这些特征帮助对未分类数据进行预测。不同领域的数据具有不同的分布特征,且名义属性、数值属性的分类效率是截然不同的,这使得传统分类器只适用于特定的场合。普适优化的分类器模型需要在克服以上困难的同时,利用尽可能多的信息对一个分类问题进行建模,以统一的方法和流程提供数据空间的特征知识,提升预测性能水平。考虑到电子商务数据集的数据量一般较大,分类器应尽量分散计算负担,以提高训练和预测计算速度。同时,电子商务的数据具有分布式,流量大等特点,其数据需要被有效整合并理解,以促进企业的发展。本文对数据挖掘相关技术进行了分析,指出现有技术存在的不足,如对数据类型,尺度和结构限制较多,且分类模型并非普适,对大型数据运算较慢等。本文描述了产生上述不足的原因,在改进现有挖掘技术的基础上,提出针对电子商务数据分布特点的新模型,并给出实验结果和模型的加速性能,通过和现有模型的对比,论证该模型方案的有效性和优越性,同时,明确相关指标阀值的重要性。
其他文献
猪肉是我国第一大肉类消费产品,随着社会经济的发展以及消费的多样化和个性化,仅仅提高产量和瘦肉率己远远不能满足人们日益增长的需求,人们对肉的品质要求也越来越高。然而
过氧化物酶是以铁卟啉为辅基的氧化还原酶,在动植物和微生物中广泛存在,可有效催化多种氧化物或过氧化物氧化其它物质。过氧化物酶不仅参与多种生理反应,还是临床检验中最常用的
正交频分复用(OFDM)技术因其具有较强的抗多径衰落能力,较高的抗窄带干扰能力和频谱利用率,且采用快速傅里叶变换和反变换的数字实现方式,受到众多研究者的广泛关注。信道估
仿古建筑是对历史还原的一种形式,它用还原的方法重塑文化殿宇,历史人文为内核,为我们了解历史提供重要参考价值。中国古代建筑经历了唐宋元明清时期后留有很多历史文化遗产
研究背景EB病毒是一种全球性分布的双链DNA病毒,属于疱疹病毒科γ亚科,超过90%的人通过唾液被感染过。被EB病毒感染后,免疫系统可以通过细胞毒性T细胞(包括CD8+和CD4+)和自然
目的总结以急性脑梗死为首发表现的隐匿性恶性肿瘤特点。方法收集2015年3月—2017年12月我院神经内科收治的急性脑梗死患者临床资料,选择其中10例在院期间检出恶性肿瘤者展开
随着旅游业的不断发展,旅游景观设计成为艺术设计中较为热门的专业,它是一种多学科结合并用的特点,即承载着保护大自然的使命,又能给游客以美的感受;它既要从当地的自然条件
有机实验是中学化学教学的重要内容,是高考、会考的常考内容。对于有机实验的操作及复习,必须注意以下八点内容。
教育不仅仅是提升理论知识,也要注重德智体的综合素质培养,所以体育教学就显得尤为重要。作为有效的教学方法,体育教学将游戏教学普遍运用在课堂中,因此本文重点在于分析探究