论文部分内容阅读
文章设计了一种自适应层次化地址表达模式,总结了70种城市门楼址表达模式和9种农村门楼址表达模式;针对门楼址层级的细粒度解析问题,设计了基于规则的字母与模式联合解码的分词方法,实现了中文门楼址成分的分割与标注的同步处理。最后使用我国5个城市不同描述粒度的地址数据验证了该方法的有效性,结果证明可满足大规模数据处理的自适应、高性能和细粒度的解析需求。