图书销量预测系统的设计和实现

来源 :中山大学 | 被引量 : 0次 | 上传用户:jincast
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着图书发行业务的垄断格局逐步被打破,市场激烈的竞争逼使图书发行集团选择技术含量更高的数据挖掘手段,提高企业的分析能力,提高企业的市场竞争力。 本文以某大型图书集团的信息化项目中的历史销售数据为对象,利用决策树方法对图书资源进行分类,挖掘出畅销书的模式,所用到的挖掘算法是决策树C4.5算法。针对C4.5算法的过度配适问题,在数据预处理中,引进了“速度”和“加速度”的属性,从而使得决策树在生成过程中,简化了计算,在一定程度上克服了C4.5易偏向于取值较多的属性这一问题,最终得到了较为理想的决策树,其结点个数明显减少,而分类精度变得更高。 在系统实现上,实现了挖掘流程可视化和模型结果可视化,允许用户和模型做一些简单的交互,帮助用户理解模型。接下来,通过误差矩阵和增益图来对模型进行评估,以检验模型的合理性和发现不足之处,从而进行改进。
其他文献
合成物体的阴影生成是当前计算机图像学、计算机视觉中的一个研究热点,它具有十分重要的应用价值。近些年出现的基于三位场景的阴影生成方法通过对某一场景和一前景物体的多
随着移动通讯技术的不断发展,具有彩色液晶屏幕并支持BREW 程序的手机已经出现并且开始被认识和接受,这样使用C/C++语言开发的手机增值应用服务也将会越来越多。由于目前在国
自1991年首次提出数据仓厍概念以来,数据仓库技术有了长足的发展,各个世界著名IT厂商纷纷推出自己的数据仓库产品,现在数据仓库已经广泛的应用于金融、保险、电信等行业,主要
随着Internet技术的快速普及和迅猛发展,网上信息爆炸式增长,如何从中找到真正有用的信息成为人们关注的焦点。作为深层数据挖掘技术的先驱,信息抽取技术可以通过对文本的浅
Internet中,数据的传送采用的是尽力而为的单播方式(best-effort),这种方式大大简化了IP层协议的复杂度,从根本上促进了Internet的成功发展。但是一对一的单播方式并不能满足所
随着计算机网络技术的迅速发展和广泛应用,分布式计算技术已经成为构建企业服务应用框架和软件构件的核心技术,而且在开发大型分布式应用系统中也表现出了强大的生命力,因此如何
形态图是一种以观察者为中心的表达方法,它列举了一个物体所有可能的“定性”形象,即用最少的特征视图(二维线图)完整的表达一个三维物体,使三维物体识别转化为2D 与2D的匹配。
随着数据库技术的飞速发展以及数据库管理系统的广泛应用,各个企业和部门通过自己的数据库管理系统,经过长年努力,已经积累了越来越多的数据。由于数据量庞大且分布于不同的地理
企业信息化建设是一项不断发展、完善的过程。传统的办公自动化系统中,存在数据信息流转速度较慢,安全性不够,对数据信息的处理、统计和分析比较烦琐,在沟通、协作和控制等方
汽轮机预测维修系统是济南大学计算机应用研究所与山东鲁能控制工程有限公司联合研发的,该系统不仅多方位、全面地显示汽轮机运行状态;而且还对汽轮机建立了完整的运行数据档案