大数据挖掘算法在刷卡中的研究与应用

来源 :青岛科技大学学报:自然科学版 | 被引量 : 0次 | 上传用户:zz9506018
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
面对海量的刷卡交易数据,普通的聚类算法和自然语言处理无法完成数据挖掘任务。本研究将MapReduce与K-means、FCM及HanLP算法相结合,不仅提高了海量数据聚类和语句分析的效率,而且可以挖掘出海量用户的刷卡行为特点,丰富和完善了客户画像。经过实验测试,基于MapReduce的聚类和自然语言分析算法运行在Hadoop集群下,不仅快速地实现了客户画像,帮助企业实现精准推销,而且为大数据环境下实现数据挖掘及自然语言分析算法的分布式并行运算提供了重要的参考和应用价值。
其他文献
当前由于农民在利益分配、利益代表和利益表达方面的困境,导致我国农业投资存在诸多缺陷,严重影响我国农民权益保护、农业持续发展。从利益分析的视角看,构建农业投资长效机制,必
本文对碟形弹簧进行了优化设计。该设计以其安装容积效率为目标函数、同时考虑应力及刚度约束。具有结构紧凑、负荷能力大而稳定的特点。
提高党的建设科学化水平是党中央总结历史经验、针对现实情况提出的重大战略任务。蕴涵着极大的理论和实践探索空间。如何实现党员教育的进一步科学化,是提高党的建设科学化水
目的:探讨乙型肝炎病毒关键基因HBx对肝细胞癌相关抑癌基因RASSF1A表达的影响及其可能的调控方式,以期理解HBx参与肝细胞癌发生的分子机制。方法:采用RT-PCR、q PCR法检测肝细
"感动中国"人物的精神具有丰富的内涵,它所体现的自强不息、勤劳勇敢,无私奉献的品质就是新时期民族精神和时代精神的表现形式,并且与社会主义核心价值体系在所处历史方位、思
国家审计的网络化成为我国未来审计工作的发展趋势之一。从分析网络审计的现有技术及存在风险入手,认为当前国家审计网络化目前不能走快速发展、普遍应用的道路,而应走一条先做
实施政治监督,是列宁的一贯思想。列宁的政治监督思想内涵深刻,包括党内监督、法律监督、人民群众监督等内容,体现了鲜明的制度化特色,具有可操作性。
推进社会主义新农村建设是一个重大课题,也是一个系统工程。农业行业协会在提高农民组织化程度、加强技术培训、引导农产品的更新、扩大生产的经济效益、增加农民收入上起到了
本文对机理不清的动态销售系统,采用随机过程统计的方法建立 ARMA(p,q)模型,利用计算机处理,实现了对具有周期性的一类商品销售额的趋势予测,从而为实现类似问题提供了简便可
文章评论了一些画几教材对直线和平面从属关系的某些论述,以使这些基本理论的叙述更严谨.