论文部分内容阅读
本文着眼于电影行业进入大数据时代后的数据挖掘技术的应用层面,旨在对未上映的电影上映后的情况进行预测.使用了两步聚类的方法对数据进行分类处理后再使用决策树分析、贝叶斯网络、Logisitc回归分析等模型判断出电影数据中重要性较高的几个属性.这些极易获取的属性将对于电影预测做出重大贡献,对各大电影网站电影推荐,以及制片商的未来电影计划产生重要影响.