论文部分内容阅读
摘要:目前我国不动产统一登记纷纷落地,各地加速推进不动产登记信息化建设。不动产登记数据整合是不动产统一登记工作的基础,为不动产登记各项业务办理提供数据支撑。不动产登记数据具有数据量大、多源异构、数据间语义描述相互矛盾、非結构化与结构化数据并存等特点。FME拥有强大的数据转换及处理分析功能,可应用于不动产数据整合的整个流程,本文主要介绍FME在数据整合过程中的实际应用,并提出相应的解决方法和思路。
关键词:不动产;存量数据整合;FME
不动产存量数据整合工作是按照国土资源部《不动产登记数据库标准》以及《不动产登记数据整合建库技术规范》,将现有的分散存放、格式不一、介质不同的不动产登记信息进行规范整合,涉及土地、房产、林权、海域等方面,从而建立统一的不动产登记数据库,实现土地、房屋等空间数据和登记业务数据、档案数据的一体化关联存储。下面主要介绍FME在不动产数据整合实际生产中的应用。
1.数据抽取及检查
不动产登记数据中房产登记数据逻辑关系复杂,涉及的表格非常多,数据量也非常大,而且是以ORACLE或SQL数据库存储,需要具备比较丰富的数据库语言能力才能对数据进行分析。而FME可以直接读取数据库,并运用一些转换器,实现对表单的分析、检查和处理,主要检查业务数据之间的逻辑关系是否正确、必填字段属性是否缺失、属性结构与国家标准是否一致等问题,并能够按标准属性字典对照表将相关字段属性进行批量转换,同时可以将分析后的问题数据直观的呈现出来,以便人工检查。此功能可应用于数据汇交及上报。用到的转换器有AttributeCreator:用于字段的创建、赋值;AttributeValueMapper:用于字段按数据字典标准的映射转换;AttributeFilter:用于字段属性过滤。主要功能设计模型如下图:
-
2.楼盘表的组建
楼盘表是管理房屋户室的抓手,对于缺失楼盘表的不动产单元,需要进行楼盘表的补建。补建楼盘表的基本原则是以户为最小单元,依照现行楼盘表规范往上依次建立起对应的层和幢信息,最终生成楼盘表。楼盘表组建之前需要对房屋坐落进行地址拆分,按照街道-小区-楼栋号-层号-户号的分类要求依次拆分,形成楼盘表基础数据,然后利用FME对数据进行重组和构建,生成楼盘表。用到的转换器有GUIDGenerator:用于给户层幢生成唯一标识码;AttributeCreator:用于对新生成的层表和幢表进行字段赋值;DuplicateFilter:用于检查同一楼盘下的层号及幢号是否有重复。主要功能设计模型如下图:
3.房地关联
不动产数据整合数据库标准中,房地产权表是国土分摊证与房屋产权证的集中体现,不动产业务办理时,需同时引用房产信息及对应的土地使用权信息,因此需将两者正确关联。房地关联主要利用房产登记及土地登记数据中的坐落、权属人这两个关键信息,通过对关键信息进行标准化处理,再将处理后的字段进行相互关联匹配,形成房地关联表。匹配的关键点在于对坐落及权属人字段的标准化清理,坐落清理一般是将坐落地址中包含的XX省、市、县、镇、街道及特殊字符等信息统一替换为空,将中文数字转换成阿拉伯数字等。权属人清理则是对共有权属人进行拆分重组。用到的转换器有StringPairReplacer或StringReplacer对字段内容进行替换,AttributeSplitter分割共有权属人,ListSorter和ListConcatenator排序和重组分割后的所有权人,FeatureMerger匹配处理后的坐落及权属人信息。主要功能设计模型如下:
4分户图信息提取及图形拆分
不动产数据整合工作也包括房屋分层分户图数据的整理,工作内容一般为先建立分户图与房产登记数据的关联,再将关联关系及对应的空间图形数据进行入库。早期的房屋分户图大多都不规范,一个DWG文件可能存放了多个户室的分户图,且没有跟房产登记数据进行关联,是脱离登记系统单独存放的。因此房屋分户图的整理就包括了3个过程,首先需要将房屋分户图上的属性信息提取出来,然后再利用属性信息与房产登记数据进行字段匹配关联,最后再将分户图进行拆分入库。分户图与房产登记数据关联的步骤和方法与房地关联类似,此处不做赘述,主要介绍下属性信息提取及图形拆分的方法。
4.1属性信息提取
分析已有历史分户图成图规则及各类属性存放的图层信息,利用VertexCreator将图上注记转成点,Offsetter将注记点平移至相邻单元格,PointOnAreaOverlayer将注记与单元格叠加分析获取注记内容,具体模型设计界面如下:
4.2图形拆分
对于同一个DWG内包含多个房屋分户图数据的情况,需要对模型进行拆分,根据图形的空间位置关系,将每个分户图外边框范围内的所有数据按原始图层进行fanout扇出即可,使得一个DWG文件只对应一个房屋分户图,实现分户图的拆分。需拆分的数据样式如下:
5结语
不动产登记数据整合工作是不断推进不动产登记的一个关键环节,是建立不动产统一登记的基础。由于数据量大,关系复杂,结构不统一,如果只依靠人工来进行整理,耗时耗力,利用FME可以为不动产存量数据整合带来较大的便捷,大大提高生产效率。
参考文献:
[1]况海涛,赵岱虹.统一的不动产登记数据库建设思路研究[J].国土资源信息化,2016(02):29-31+19
[2]黄云康.基于ETL技术的不动产数据整合策略研究[J].地理空间信息,2017,15(06):22-25+30+4
[3]郑金水.浅谈新形势下不动产测绘管理[J].测绘地理信息,2015,40(04):87-89
[4]杨梅,陈利燕,詹金瑞.基于FME的不动产数据抽取整合建库技术研究[J].测绘与空间地理信息,2018,41(04):189-191
[5]张正明,徐海洋.不动产登记地籍与房产数据整合建设关键技术研究[J].现代测绘,2016,39(04):56-58
关键词:不动产;存量数据整合;FME
不动产存量数据整合工作是按照国土资源部《不动产登记数据库标准》以及《不动产登记数据整合建库技术规范》,将现有的分散存放、格式不一、介质不同的不动产登记信息进行规范整合,涉及土地、房产、林权、海域等方面,从而建立统一的不动产登记数据库,实现土地、房屋等空间数据和登记业务数据、档案数据的一体化关联存储。下面主要介绍FME在不动产数据整合实际生产中的应用。
1.数据抽取及检查
不动产登记数据中房产登记数据逻辑关系复杂,涉及的表格非常多,数据量也非常大,而且是以ORACLE或SQL数据库存储,需要具备比较丰富的数据库语言能力才能对数据进行分析。而FME可以直接读取数据库,并运用一些转换器,实现对表单的分析、检查和处理,主要检查业务数据之间的逻辑关系是否正确、必填字段属性是否缺失、属性结构与国家标准是否一致等问题,并能够按标准属性字典对照表将相关字段属性进行批量转换,同时可以将分析后的问题数据直观的呈现出来,以便人工检查。此功能可应用于数据汇交及上报。用到的转换器有AttributeCreator:用于字段的创建、赋值;AttributeValueMapper:用于字段按数据字典标准的映射转换;AttributeFilter:用于字段属性过滤。主要功能设计模型如下图:
-
2.楼盘表的组建
楼盘表是管理房屋户室的抓手,对于缺失楼盘表的不动产单元,需要进行楼盘表的补建。补建楼盘表的基本原则是以户为最小单元,依照现行楼盘表规范往上依次建立起对应的层和幢信息,最终生成楼盘表。楼盘表组建之前需要对房屋坐落进行地址拆分,按照街道-小区-楼栋号-层号-户号的分类要求依次拆分,形成楼盘表基础数据,然后利用FME对数据进行重组和构建,生成楼盘表。用到的转换器有GUIDGenerator:用于给户层幢生成唯一标识码;AttributeCreator:用于对新生成的层表和幢表进行字段赋值;DuplicateFilter:用于检查同一楼盘下的层号及幢号是否有重复。主要功能设计模型如下图:
3.房地关联
不动产数据整合数据库标准中,房地产权表是国土分摊证与房屋产权证的集中体现,不动产业务办理时,需同时引用房产信息及对应的土地使用权信息,因此需将两者正确关联。房地关联主要利用房产登记及土地登记数据中的坐落、权属人这两个关键信息,通过对关键信息进行标准化处理,再将处理后的字段进行相互关联匹配,形成房地关联表。匹配的关键点在于对坐落及权属人字段的标准化清理,坐落清理一般是将坐落地址中包含的XX省、市、县、镇、街道及特殊字符等信息统一替换为空,将中文数字转换成阿拉伯数字等。权属人清理则是对共有权属人进行拆分重组。用到的转换器有StringPairReplacer或StringReplacer对字段内容进行替换,AttributeSplitter分割共有权属人,ListSorter和ListConcatenator排序和重组分割后的所有权人,FeatureMerger匹配处理后的坐落及权属人信息。主要功能设计模型如下:
4分户图信息提取及图形拆分
不动产数据整合工作也包括房屋分层分户图数据的整理,工作内容一般为先建立分户图与房产登记数据的关联,再将关联关系及对应的空间图形数据进行入库。早期的房屋分户图大多都不规范,一个DWG文件可能存放了多个户室的分户图,且没有跟房产登记数据进行关联,是脱离登记系统单独存放的。因此房屋分户图的整理就包括了3个过程,首先需要将房屋分户图上的属性信息提取出来,然后再利用属性信息与房产登记数据进行字段匹配关联,最后再将分户图进行拆分入库。分户图与房产登记数据关联的步骤和方法与房地关联类似,此处不做赘述,主要介绍下属性信息提取及图形拆分的方法。
4.1属性信息提取
分析已有历史分户图成图规则及各类属性存放的图层信息,利用VertexCreator将图上注记转成点,Offsetter将注记点平移至相邻单元格,PointOnAreaOverlayer将注记与单元格叠加分析获取注记内容,具体模型设计界面如下:
4.2图形拆分
对于同一个DWG内包含多个房屋分户图数据的情况,需要对模型进行拆分,根据图形的空间位置关系,将每个分户图外边框范围内的所有数据按原始图层进行fanout扇出即可,使得一个DWG文件只对应一个房屋分户图,实现分户图的拆分。需拆分的数据样式如下:
5结语
不动产登记数据整合工作是不断推进不动产登记的一个关键环节,是建立不动产统一登记的基础。由于数据量大,关系复杂,结构不统一,如果只依靠人工来进行整理,耗时耗力,利用FME可以为不动产存量数据整合带来较大的便捷,大大提高生产效率。
参考文献:
[1]况海涛,赵岱虹.统一的不动产登记数据库建设思路研究[J].国土资源信息化,2016(02):29-31+19
[2]黄云康.基于ETL技术的不动产数据整合策略研究[J].地理空间信息,2017,15(06):22-25+30+4
[3]郑金水.浅谈新形势下不动产测绘管理[J].测绘地理信息,2015,40(04):87-89
[4]杨梅,陈利燕,詹金瑞.基于FME的不动产数据抽取整合建库技术研究[J].测绘与空间地理信息,2018,41(04):189-191
[5]张正明,徐海洋.不动产登记地籍与房产数据整合建设关键技术研究[J].现代测绘,2016,39(04):56-58