房产数据向量对齐的算法研究

来源 :成都理工大学 | 被引量 : 2次 | 上传用户:wangchaohui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
四川省2018年发布了1亿元的房产数据调查合同,采集成都、眉山等4个城市的房产数据,合同接受单位的数据采集完全靠人工线下实现,然而房产市场的数据来源众多,房屋数据的整合具有数据量大、数据多源异构、数据缺失等难点,为我国房产税征收的房屋数据预调研的造成了阻碍。为提高采集数据的效率,受房产数据调查合同接收方委托,本文提出了一种基于粒子群优化的房产数据向量对齐算法,来对不同中介二手房房源进行实体匹配,主要工作如下:1.编写Scrapy爬虫获取初始二手房房源数据。我们将爬取的二手房数据进行数据预处理,包括对数据不完整的数据进行补全、对两个中介二手房源数据进行归一化处理。2.提出了房产数据的归一化的带权值向量模型。首先,根据房产属性类型的多样性,分别对数值、文本、图片三种类型数据进行数值化建模为[0,1]的数据向量;然后,再结合房地产数据向量不同属性对房源相似性判断的影响不同,形成了带权值的房产数据向量模型。3.提出了基于粒子群优化的房产数据向量对齐算法。把不同房产属性的权值组成的向量看作是一个粒子个体,利用自适应权重改进的粒子群算法,对不同属性相似度权值进行优化处理,最终得到了不同属性相似度权值和二手房房源相似度的阀值。本文的创新之处在于根据二手房房源数据的多源异构,构建了根据不同数据类型房产数据向量及其属性模型。并首次利用实体对齐技术实现基于粒子群算优化的房地产数据向量对齐。通过与几种常见的分类器和标准粒子群算法分类相比,本文设计的算法在房地产数据向量对齐效果方面取得了明显改善。
其他文献
本文将微生物电解池技术与厌氧颗粒污泥技术耦合,并探究耦合体系在废水COD(chemical oxygen demand)去除率、产气量、库伦效率以及降解2,4,6-TCP(2,4,6-trichlorophenol)的性能,并与微生物电解池体系和厌氧颗粒污泥体系相比较。探究石墨板为阳极材料的耦合体系性能后,将阳极材料换为比表面积更大的碳毡并利用曲面响应实验法优化耦合体系中乙酸钠浓度和厌氧颗粒污泥的
可见光通信系统在照明的同时,还可以用来通信。因其无电磁干扰,频谱资源丰富以及绿色环保等诸多优点得到了飞速发展。然而在传统可见光通信系统中,多使用前置均衡器来提高LED
EA4T是典型的高速动车组车轴用钢,由于空气动力学的作用,列车在运行中极容易卷起碎石、道砟等异物并冲击车轴造成一定程度的表面损伤,引起车轴疲劳性能的下降,导致严重的事故。本文针对实际车轴表面损伤,采用不同方法在车轴钢试样表面制备损伤缺陷,探究缺陷与疲劳性能的关系,尝试为我国动车组车轴外物损伤评价、检修标准的制定提供一定的参考。得到如下结论:(1)EA4T车轴表层为回火索氏体,硬度约为218 HBW
随着大数据的蓬勃发展,大数据背景下的数据驱动型企业在市场竞争中占据了优势地位。数据驱动型企业的运营模式和盈利模式与传统实体企业存在巨大差异。网络外部性、规模性等
在解决高维多目标优化问题过程中,由于非支配解的数量在种群中所占比例过大,因此不能使用Pareto支配策略将优秀的解从解集中提取出来。当目标数量达到8时Pareto支配策略将完全失效,导致基于这个策略的经典算法在解决高维问题时遇到很大的阻碍。因此,本文提出一种面向权重的子种群拐点的算法。通过权重划分的方法可以将整个种群划分成多个子种群,通过每条权重上关联的拐点解来引导种群中的其他解的进化,进行多角度
无人机因其体型小巧、灵活性高、成本低、易维护受到大众的关注。无人机在室外通常依赖GPS为其提供定位信息,但当无人机在森林,隧道,室内等弱GPS或无GPS信号的场景工作时,将
我们生活在一个三维的空间中,我们所能感受到的都是实际存在的三维物体。同时每一个物体都有其独特的外部形状结构和内部分子结构,从而体现出它独特的空间立体感。随着互联网和经济的高效发展,三维模型出现在了人们的视野,各种信息化技术将其应用在了各个领域。随着三维模型的广泛应用,对三维模型相关的技术需求也日益渐增。在飞机钣金零件行业三维模型的应用也渐渐出现,为了使工程工作链更便捷化,在飞机钣金零件生产和喷涂等
随着集成电路产业工艺水平的持续进步,,集成电路中芯片的性能和集成度依据摩尔定律不断提升。与此同时摩尔定律逐渐走向终结,此时借助垂直方向进行芯片堆叠的技术应运而生。3
随着氮化镓(Ga N)基发光二极管(LED)应用越发广泛,对器件性能的要求也越来越高,需要我们制备出高质量的Ga N外延薄膜以提升LED器件的光学性能和电学性能。当前我们生长Ga N材料主
从无线通信的发展历史来看,对数据流量越来越高的需求始终是每次重大变革的主要驱动因素。5G时代的来临已经催生了视频直播、虚拟现实等一系列新兴高宽带、高数据传输率业务