【摘 要】
:
本文以数字电视运营行业为背景,研究了数据挖掘技术在数字电视运营支撑管理系统中的应用范围和使用方式。以聚类算法CLARANS为重点,分析了该算法在处理大数据集时所产生的聚
论文部分内容阅读
本文以数字电视运营行业为背景,研究了数据挖掘技术在数字电视运营支撑管理系统中的应用范围和使用方式。以聚类算法CLARANS为重点,分析了该算法在处理大数据集时所产生的聚类结果在准确性、稳定性和效率等方面的不足,提出一种基于空间网格结构的GCLARANS算法。结合数字电视运营支撑管理系统的技术架构,设计并实现了一种基于改进的GCLARANS聚类算法的数字电视客户细分模型。本文围绕这一主题,主要做了以下工作:(1)首先,介绍数据挖掘和数字电视运营支撑管理系统的基本概念,分析了数据挖掘技术在数字电视运营支撑管理系统中的应用领域。(2)其次,重点介绍聚类技术的概念、聚类技术的分类以及聚类算法的评价标准。针对CLARANS算法在处理大型数据集合时准确性、稳定性较差以及效率较低的问题,确立了以优化初始节点选择、减少邻居节点探索过程中的运算量为出发点来改善CLARANS算法,并通过实验对改进算法GCLARANS的有效性进行了验证。(3)再次,根据客户细分理论,提出了一种客户相似度模型,结合GCLARANS算法,给出了完整的数字电视客户细分模型的实现,并在真实数据集合上对模型的有效性进行了验证。(4)最后,结合数字电视运营支撑管理系统的技术架构,详细介绍了数据挖掘系统的构建过程。本文的研究成果,包括数据挖掘算法以及数据挖掘系统的构建方法,不仅可以应用于数字电视运营行业,也可以应用于其它行业。对于计划构建或正在构建数据挖掘系统的企业具有一定的参考价值和指导意义。
其他文献
基于核的学习算法是一种新兴的重要的分类技术,近年来己被广泛研究,并且成功应用于模式识别.图像处理等等相关领域。传统的核方法通常仅使用标准的核函数,如线性核和RBF核,因此
蛋白质的三维结构决定其生物功能,折叠模式是蛋白质空间拓扑的一种分类表达。自然界中的蛋白质结构约十多万种而折叠模式的总数约一千多种。因此,蛋白质折叠模式预测研究具有
近年来,由于XML具有良好的结构性和可扩展性,并且允许用户根据自己的需要定义自己的标记,XML逐渐成为网上数据表示和交换的主要格式。在Internet应用中,存在大量的XML文档,如
对分布式数据流的分析与挖掘正与日俱增地在众多领域变得十分重要,如网络流分析和金融交易分析等。在分布式环境中,将所有数据都传输到一个节点进行处理是不现实的;更加合理
无线局域网(Wireless Local Area Network, WLAN)是20世纪90年代计算机网络技术与移动通信技术相结合的产物,在现实生活中得到广泛应用,满足了人们对于宽带无线接入网络的迫
随着计算机网络技术的不断发展以及多媒体的迅速普及,多媒体应用已经深入到生活的各个领域。在开放的网络环境中,涉密的多媒体信息在传输和存储中的安全是政府部门、企业和个
随着互联网络的快速发展,人类的生活方式正发生着巨大的改变。博客、微博、QQ、社区网站、门户网站等等这些互联网上的新事务让我们能获取更多的信息,学会更多的交流,离开了这些
智能交通系统(Intelligent Transportation System,简称ITS)是目前世界交通运输领域的前沿研究课题,其核心是针对日益严重的交通需求和环境保护压力,采用信息技术、通信技术、计算
随着计算机和互联网的发展,在自然语言处理领域,以双语(或多语)平行语料库为基础的应用日益增多。除机器翻译方面的应用之外,平行语料库的建设对于双语词典编纂、词义消歧和
计算机技术和网络技术得到了不断的发展,计算机系统也从独立的主机发展到复杂的、互联的开放式系统,这种情况导致计算机及网络的入侵问题越来越突出,为了保护系统资源,需要建