网络文本地理信息提取技术研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:xingyongxiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络中蕴涵了丰富的地理信息,于是网络也成为了获取地理信息的重要源头。传统获取地理信息的方式必须依赖于大批人力和时间,这导致了地理信息相关产业更新周期比较长、获取信息有限的状况。本文研究主要针对网络文本中存在的大量非结构化地理信息,提出了基于条件随机场(Conditional Random Fields,CRFs)与支持向量机(Support Vector Machine,SVM)的层叠模型来获取结构化地理信息的方案,最后获取<地理实体、属性、属性值>三元组形式的地理信息。实验结果显示网络文本地理信息提取的准确率为83.98%,召回率为82.03%、F值为82.99%,证明了该方案的有效性。论文的主要研究工作包括如下两个方面:(1)在第一层模型中,将地理实体的属性及属性值当作两类命名实体,采用基于CRFs模型将属性、属性实体同地理实体一起识别出来。考虑到部分地理实体、属性实体具有规律性和稳定性,因此在设计地理实体、属性实体特征模板时添加了外部的词典特征。最后设计对比实验证明了本文基于CRFs模型识别地理信息实体的高效性,词典特征的有效性。(2)在第二层模型中,对于上层识别出来的地理信息实体(地理实体、属性实体、属性值实体),并不能确定地理实体与属性实体、属性实体与属性值实体之间的对应关系,于是采用基于SVM模型来判断地理信息实体(地理实体、属性实体、属性值实体)之间是否存在对应关系。考虑到地理信息语料预处理后,用于SVM训练学习的特征集合比较大,可能存在一些无用的、冗余的特征项,本文借鉴了其他研究中的信息增益特征选择算法,并对其不足进行了改进。最后设计对比实验证明了本文使用SVM模型提取地理信息实体关系的高效性,改进后的信息增益特征选择算法更加有效。
其他文献
导读:随着温饱问题的基本解决.人们逐渐从“吃饱”转向“吃好”,农产品的安全性和营养价值得到更多关注。当前蔬菜的消费需求较高,且在高收入群体中拥有巨大潜力,这给蔬菜的品牌建
政府行为对地方产业发展有重要引导支持作用。当前农村特色产业面临基础薄弱、转型困难等障碍,需要地方政府扮演好引导者与扶持者的角色,利用电商发展浪潮,推动农产品电商发展,实现农村产业振兴、农民增收创收。本研究以组织行为理论、政府职能理论与“理性经济人”假设作为理论视角,以系统科学方法作为理论工具,在分析我国政府职能权责结构基础上,着眼于县域农产品电商发展实际,对广西平果县政府主导发展农产品电商的行为进
目前,抽水蓄能机组设备检修主要采取定期维修方式,维修周期主要依据国标、行标及企业运维经验制定,故容易导致过度检修,造成资源浪费。状态检修在抽水蓄能行业处于试点推行中,设备在线监测系统仅监测实时状态,无法进行故障预测,从而给出维修时机的建议。本文针对上述的抽水蓄能机组设备维修决策中一些问题进行了研究,主要解决对蓄能机组子系统、零部件的设备重要度评估问题,如何选择维修方式以及如何确定维修时机的问题。以
关于市场集中度与市场势力的研究主要集中于传统产业,但针对网络零售业市场势力的研究较为有限。理论上,高市场集中度通常会引致市场垄断,亦或促使市场份额较大的企业滥用市
静脉穿刺是日常护理中最常用的操作技术之一,但在穿刺过程中若操作失当很容易引起穿刺部位的皮下瘀血,在临床中也比较常见。本文选取1例静脉穿刺致整手背皮下瘀血的病例进行分
目的:总结近10年剖宫产率、剖宫产指征变化及剖宫产对母婴影响。方法:回顾性分析近10年剖宫产孕妇的临床资料。结果:①剖宫产率逐年升高,1995年为36.4%,2004年上升为86.2%②1995-1999
土壤磷素的循环主要为微生物、植物与土壤之间循环,解磷微生物的种类及解磷活性决定了土壤中植物的生长状况。本实验从新疆省昌吉市采集土样,并纯化分离出30株解磷菌,经平板检测发现其中六株解磷能力较好,随后的摇瓶培养筛选出1株高效解磷菌B5,并对其进行遗传特性鉴定及各种生化鉴定,之后对其溶解无机磷的机制进行探索与研究,实验最后将该菌施于盆栽实验中,检测植物施用菌液后植株各项生长指标的变化。经实验表明,以磷