【摘 要】
:
由于信息化产业的迅猛发展,社会各领域产生的数据呈现指数级增长,而膨胀的数据中却蕴含了无穷的信息亟待人们去探索,此时,诞生了一门新的科学技术,数据挖掘与知识发现,旨在通
论文部分内容阅读
由于信息化产业的迅猛发展,社会各领域产生的数据呈现指数级增长,而膨胀的数据中却蕴含了无穷的信息亟待人们去探索,此时,诞生了一门新的科学技术,数据挖掘与知识发现,旨在通过有效方法在大量数据中发现有价值的信息。如今,数据挖掘的飞速发展使得多种数据挖掘算法可以应用到多个领域。地理位置信息的研究与应用自从搜索引擎的发展开始越来越受到人们的关注,随着移动互联网的热潮再一次得到了迅猛的发展,针对地理位置信息与其相关联的物理信息进行数据挖掘的研究也被大量展开。本文基于北京市开放地理标志数据集,分别选取了以北四环和南四环为核心10公里范围内的地标数据点,针对北四环附近房价较高且人口密集的实际情况,通过数据挖掘的相关技术,对北四环附近的地理位置信息规则进行挖掘,试图探究不同类别的城市标志对于地区房价乃至繁荣程度的影响规则,并对其进行合理有价值的科学解释。结合本文中地理位置信息的特殊性,传统的关联规则挖掘方法并不能够适用。因此,在本文的实验中,通过对关联规则挖掘的数据预处理和挖掘具体流程进行研究和改进,最终实现了挖掘结果的生成和解释,主要概括如下:(1)引入聚类算法,将存放地理位置信息的关系型数据库转化为布尔型数据库。由于地理位置信息都是离散的坐标点,无法作为Apriori算法输入的布尔型事务数据库,本文引入了基于密度的聚类算法,对表示地理位置信息的点集合进行聚类,将得到的簇作为一条事务,生成布尔型数据库。(2)改进关联规则挖掘算法的事务集划分方法。针对事务集容量过大导致数据库庞大进而致使挖掘效率低下、算法速度缓慢的问题,本文对事务集划分方法进行了改进,对关联规则挖掘步骤进行了粗细粒度的拆分,并结合FP-Tree算法提升关联规则挖掘的整体效率,有效提升了算法的运行速度,提高了算法发现有效关联规则的能力。(3)对关联规则挖掘引入扩展信息。结合地理位置信息距离的特性,本文依据挖掘结果,将距离信息扩展到地标类型中,对扩展挖掘结果进行更深层次的解释。
其他文献
船舶电力系统生命力是一个崭新的、充满挑战的课题,多年以来,中国有关人士对它的研究不够细致、不够深入.随着电力系统在船舶上的地位越来越突出,其生命力的评估、论证、设计
同轴电缆/光纤混合网(HFC)是一种刚新兴起的通信技术,它在带宽利用、保护投资方面具有很大的优势,成为最具竞争性的宽带多媒体通信网络.该论文对HFC技术及其工程应用进行了比
该文就变结构控制理论在潜艇操纵控制,特别是减摇控制中的应用作理论上的研究和探索.重点是研究水平面内的航向和横摇控制以及垂直面内的纵倾和定深控制.
该文对开关磁阻电机计算机调速系统进行了研究与分析,首先比较了开关磁阻电机的各种电机结构,主电路结构型式的特点.进而研究了电机的典型运行特性和四象限运行的基本控制方
该论文共分为六章,首先阐述了模糊控制的基本原理基本方法,并对模糊控制的推理 算法进行比较和分析.然后,将模糊控制理论应用于船舶航向控制系统中,进行船舶航向控制系统的总
增程发电系统由发动机、发电机和其控制器组成,其应用于电动汽车能够延长蓄电池寿命并提升整车续行里程,且燃油经济性较好,是现阶段以较低成本满足人们出行需求并具有较好节能减排效果的电动汽车解决方案。本文以低速电动汽车为适用对象,主要研究增程发电系统的参数确定、控制方法及能量管理策略。首先,根据对低速电动汽车的驱动功率需求分析,确定了增程发电系统用发动机参数。由于通用发动机转速不能精确调节,本文采用永磁同
摄象机定标是机器人视觉的基本任务.在需要建立三维物点与二维图象关系的场合,首先就要对摄象机进行标定.论文对视觉系统定标技术进行了深入的研究.论文在研究了成像几何模型
针对治理1998年价格总水平上涨后导致的经济衰退、市场疲软状况,中国政府采取了各项启动经济的扩张性措施.1992年以来经济开始高速增长.为平抑过热经济、抑制物价总水平,政府
该论文从激光平台系统分析和设计的实际需要出发,探讨了平台设计面临的三个重问题,即激光平右系统建模,激光平台系统分析和仿真软件的设计以及平台支撑系统的故障检测.具体地
能源与环境的矛盾关系已经成为当今社会关注的焦点和热点。锂离子电池作为一种清洁高效的能源转换与存储器件,在能源和环境保护方面占有极其重要的地位,其中薄膜锂离子电池由于