基于伪语义相似度模型的中文地址匹配方法

来源 :测绘通报 | 被引量 : 0次 | 上传用户:lyyzk09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
地址匹配中,由于传统相似度模型受字符重叠数影响大,在处理简写、缩写地址要素单元时,错误匹配问题突出;深度学习方法需要大量样本支撑,但庞大的数据量和多样的形式,导致生成样本的成本过高.为解决上述问题,本文首先应用基于条件随机场和双向长短时记忆神经网络的模型,对地址进行分词;然后通过建立一种伪语义相似度,对地址要素进行分级匹配.通过对公安业务中地址数据进行测试,在对缩写、简写等不规范地址描述方面,本文模型能较理想地完成任务,各参考指标均高于0.9.
其他文献
一、谈话导入,读文识字rn师:同学们,刚刚过了一个暑假,谁在这个暑假长高了?长高的同学摸摸自己的头顶.rn(很多学生兴奋地摸自己的头顶)rn师:看来过了一个暑假,过了一个夏天,好多同学都长高了.我们今天就来学一篇和夏天,和成长有关的课文——《夏天里的成长》.请大家自由地放声朗读课文,注意读准字音,读通句子.
期刊
三、路径:现代诗歌大单元教学建议rn首先,对短诗《繁星》三首的教学建议.要把一个文本教好,必须把文本解读好,理解好.我们来尝试解读冰心的《繁星》.rn第一个问题:诗中的“这些事”能否改为“这些人、这些景”?第一首《繁星(七一)》,仔细推敲,我们发现这首诗根本没写事,它其实写的是景:月明的园中,藤萝的叶下,母亲的膝上,这是一个场景.那么,能不能把“这些事”改成“这些景”——“这些景是永不漫灭的回忆”?诗人为什么用“这些事”,这是第一个值得我们研究的问题.
期刊
《故事二则》是四年级上册第八单元的一篇略读课文.这篇课文和《王戎不取道旁李》《西门豹治邺》以及口语交际“讲历史人物故事”组合搭配,共同构成了一个完整的历史故事专题.相较于本单元简要复述课文内容的总体目标,《故事二则》的导读部分又更加明确要求“找出课文中表示故事发展先后顺序的词句,简要复述这两个故事”,可以说是目标与方法的统一.
期刊