基于伪语义相似度模型的中文地址匹配方法

来源 :测绘通报 | 被引量 : 0次 | 上传用户：lyyzk09

【摘要】

：

地址匹配中,由于传统相似度模型受字符重叠数影响大,在处理简写、缩写地址要素单元时,错误匹配问题突出;深度学习方法需要大量样本支撑,但庞大的数据量和多样的形式,导致生成样本的成本过高.为解决上述问题,本文首先应用基于条件随机场和双向长短时记忆神经网络的模型,对地址进行分词;然后通过建立一种伪语义相似度,对地址要素进行分级匹配.通过对公安业务中地址数据进行测试,在对缩写、简写等不规范地址描述方面,本文模型能较理想地完成任务,各参考指标均高于0.9.

【作者】

：

郁汀王铎陈钦

【机构】

：

公安部第三研究所,上海200031;复旦大学,上海200433;复旦大学,上海200433;公安部第三研究所,上海200031

【出处】

：

测绘通报

【发表日期】

：

2022年3期

【关键词】

：

条件随机场和双向长短时记忆神经网络地址要素解析伪语义相似度地址匹配地址标准化

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

《夏天里的成长》第一课时教学实录

一、谈话导入,读文识字rn师:同学们,刚刚过了一个暑假,谁在这个暑假长高了?长高的同学摸摸自己的头顶.rn(很多学生兴奋地摸自己的头顶)rn师:看来过了一个暑假,过了一个夏天,好多同学都长高了.我们今天就来学一篇和夏天,和成长有关的课文——《夏天里的成长》.请大家自由地放声朗读课文,注意读准字音,读通句子.

期刊

现代诗歌大单元教学研究(下)

三、路径:现代诗歌大单元教学建议rn首先,对短诗《繁星》三首的教学建议.要把一个文本教好,必须把文本解读好,理解好.我们来尝试解读冰心的《繁星》.rn第一个问题:诗中的“这些事”能否改为“这些人、这些景”?第一首《繁星(七一)》,仔细推敲,我们发现这首诗根本没写事,它其实写的是景:月明的园中,藤萝的叶下,母亲的膝上,这是一个场景.那么,能不能把“这些事”改成“这些景”——“这些景是永不漫灭的回忆”?诗人为什么用“这些事”,这是第一个值得我们研究的问题.

期刊

《故事二则》教学设计

《故事二则》是四年级上册第八单元的一篇略读课文.这篇课文和《王戎不取道旁李》《西门豹治邺》以及口语交际“讲历史人物故事”组合搭配,共同构成了一个完整的历史故事专题.相较于本单元简要复述课文内容的总体目标,《故事二则》的导读部分又更加明确要求“找出课文中表示故事发展先后顺序的词句,简要复述这两个故事”,可以说是目标与方法的统一.

期刊

基于伪语义相似度模型的中文地址匹配方法

其他学术论文