【摘 要】
:
目前电子地图兴趣点(POI)分类标注主要采用人工判断方法,存在POI标注工作量大和频繁变动问题。本文研究了基于机器学习方法的POI分类自动标注算法,以已校准的POI数据为基础,
论文部分内容阅读
目前电子地图兴趣点(POI)分类标注主要采用人工判断方法,存在POI标注工作量大和频繁变动问题。本文研究了基于机器学习方法的POI分类自动标注算法,以已校准的POI数据为基础,首先对门店名称做中文分词预处理之后,建立短文本向量空间模型,然后采用信息增益方法,筛选出主要的分类特征词典,再基于朴素贝叶斯模型估算样本在各分类下选择概率。测试结果表明,该算法取得较高的正确率,可以替代人工判断。
其他文献
<正> 周:时下正出现纪实文学热,值得研究。所谓热,表现在两方面:一是数量多,不仅有百家期刊隆重推出“中国潮”报告文学征文,而且几乎每家文学期刊每期都有这类作品作为重磅
目的对云南省玉溪市一个家族性肥厚型心肌病的家系成员进行候选致病基因筛查,分析基因型和表型之间的关系,为家族性肥厚型心肌病的分子遗传学机制研究、早期筛查、早期干预治
如何形成正确的远程教育质量观,如何保证远程教育的质量,如何让劳动力市场认可远程教育的人才培养水平,仍是未来我国发展高质量远程学历教育面临的严峻挑战。因此,调查亚洲典
<正> 嘈嘈大弦嘈嘈如急雨,小弦切切如私语嘈嘈,课本注: "形容声音的粗重。"按: 《广雅·释诂》王念孙《疏证》:"《鲁灵光殿赋》‘耳嘈嘈以失听’李善注引《埤仓》云: ‘嘈嘈,
本文从减少黑色素生成、角质剥脱剂、植物防晒剂、基因水平上抑制黑色素形成、减少黑色素传送到角质细胞等方面分析了植物美白的作用机制。介绍了曲酸、植物多酚、根皮素、维
夏衍的30年代剧本创作内涵了一个审美文化特征:政治文化意识。本文试图引进政治文化研究视角,从剧本文本、人格政治化、大众阅读期待三方面来分析夏衍30年代剧本创作如何表现
"名转动词"、"动词化"或"名词转换为动词"是一个十分常见的语言现象,它有其自身的语言学理据和实际应用的特点。对英语名词动词化进行研究,进一步掌握其规律,对英语语言的研
佛教文化旅游资源的开发是一项需要慎重对待的工作。但目前中国佛教文化旅游资源的开发仍然存在许多问题,作为开发者应着眼透过大量的的实体性景观(如寺、塔、窟、雕塑、壁画
<正> 一、电路故障的成因 通常,由于空气的污染和设备所处的环境及管理条件不同,空气中的灰尘、油污、酸碱及其气体、盐分、潮气、炭渍、金属尘埃、各种机械杂质等污染物质,