【摘 要】
:
从特征选择、局部区域划分和词汇语义相似性计算入手,利用随机词汇迭代模型(random terms iterative model,RTIM)进行海量兴趣点(point of interest,POI)文本分类。通过词汇频度、集中度和离散度方法筛选出特征词汇;依据文本与各POI类别间的相似度进行局部区域划分;在每个局部区域内基于词汇在文本中的排列顺序构建词频向量,基于词频向量中词频的随机删除和重构,
【机 构】
:
广西师范学院北部湾环境演变与资源利用教育部重点实验室,广西师范学院资源与环境科学学院,武汉大学测绘遥感信息工程国家重点实验室
【基金项目】
:
国家自然科学基金资助项目(41361022),广西北部湾重大基础研究专项基金资助项目(2011GXNSFE018003,2012GXNSFEA053001)
论文部分内容阅读
从特征选择、局部区域划分和词汇语义相似性计算入手,利用随机词汇迭代模型(random terms iterative model,RTIM)进行海量兴趣点(point of interest,POI)文本分类。通过词汇频度、集中度和离散度方法筛选出特征词汇;依据文本与各POI类别间的相似度进行局部区域划分;在每个局部区域内基于词汇在文本中的排列顺序构建词频向量,基于词频向量中词频的随机删除和重构,获取特征映射矩阵;通过特征映射矩阵将文本转为特征向量,并采用SVM分类器进行POI文本分类。实验证明,该
其他文献
引力搜索算法是模拟万有引力定律进行搜索的一种新颖的优化算法,已有研究表明该算法比传统的一些优化算法拥有较好的收敛性能,但该算法在局部搜索能力上有所欠缺。提出一种基于惯性递减权重的引力搜索算法(gGSA),该算法能够在局部进行进一步的探索,强化局部搜索能力。该算法应用到基于VaR的证券最优投资组合模型中,解决证券投资组合优化的问题,并以上证50指数中成分股于2012年上半年日收盘价格作为测试数据集进
为了提高三次样条构造的可行性,基于矩阵的伪逆方法,提出一种不依赖额外约束条件的三次样条构造的伪逆解法。该解法通过求解出三次样条二阶导数的最小范数解,从而较好地构造出三次样条函数。理论分析及数值实验结果表明该三次样条构造的伪逆解法具有简单、有效等特点。综合分析各种构造解法的性质,对各种三次样条构造解法进行归类比较,为在实际工程计算应用中选择合适的三次样条构造解法提供了指导方向。
为了节约存储空间和方便系统升级,将虚拟机镜像中的系统数据和用户数据分离存储是云计算中心内常见的做法。目前主流的使用方法是以系统镜像启动虚拟机,再将用户数据以磁盘形式挂载,但这种粗粒度的融合方式导致数据分离对用户可见,同时用户数据无法覆盖系统数据,系统缺乏灵活性。针对这些问题,通过分析系统镜像和用户镜像合并启动和使用的原理,提出了一种将多个镜像文件细粒度混合到运行时文件系统的方案,并借助于Union
研究了一维和二维无线传感器网络(WSN)在空间信号源相关条件下的最优传感器配置方法。WSN通过分布的传感器节点得到与位置相关的测量数据,然后恢复出具有空间相关性的信号。WSN重建信号的基本准则是使重建信号和原信号在单位区域能量恒定条件下的均方误差(MSE)最小。研究了在具有有限节点的小网络和具有有限节点密度的大网络中传感器节点密度和空间数据相关性对网络性能的影响,定量分析了各种不同网络参数间的相互
针对列车重载和高速运行时轮轨间粘着存在极限状态以及此时最优粘着利用能否获得的问题,利用所提出的动态多子群QPSO算法训练神经网络,并基于训练好的神经网络设计了机车粘着智能优化控制器,通过对电机转矩的动态调整,实现了轮轨间粘着的最优利用。仿真研究中,利用典型测试函数对所提出的动态多子群QPSO算法进行性能测试,证明该算法具有相对较高的寻优精度和效率,能有效提高神经网络的收敛速度和学习能力,将该算法应
为了解决基于项目和基于用户的推荐结果的融合问题,提出了基于评分可信度的协同过滤融合方法。该方法在推荐对象集合中计算评分数大于平均评分数的对象作为信任子群,在信任子群上计算能够使推荐的平均绝对误差最小的融合参数λ。由计算得到的最优融合参数λ对基于项目和基于用户的推荐结果进行融合,作出推荐。实验结果表明,该算法有效提高了过滤推荐的精准度和可靠性,具有良好的推荐效果。
如何均衡使用网络节点能量并生成高可靠路由是WirelessHART网络研究的一个难题,为此提出了一种GRAEB(graph routing algorithm based on energy balancing)图路由算法。首先,网络被初始化为连通的图结构,能够提高丰富的冗余路径。网络管理器根据全网节点剩余能量、通信周期、链路分布等因子生成节点鲁棒系数矩阵,节点通过比较邻居的鲁棒系数来选择最优路径
针对无线传感器网络路由发现过程中安全性评估问题,提出一种新的自适应威胁模型。该模型通过对传统Dolev-Yao模型进行改进,将攻击分为限定接收传输范围的单个攻击者到不限定任何能力的多个共谋攻击者等九类,在无须任何安全假设的情形下对不同路由发现过程的攻击进行分类安全评估,自适应地确定破坏协议时的攻击强度和破坏协议所需的最小攻击强度,以评估路由发现协议的安全性,进而采取相应的安全措施予以预防。最后以一
针对现有信息检索系统查询性能的不足,提出了一种结合相关规则和WordNet本体信息的查询扩展方法。该方法借助相关规则挖掘和WordNet本体信息构建加权词语关系图,并根据加权图的结构和权重信息计算扩展词的重要性。查询时,从这个图中取原查询词的最邻近词作为扩展词来源,选取其中权重最大的p个词返回并进行二次检索。在实现算法的基础上,通过Lucene全文检索器进行实验,将所得的结果值F1与其他算法的结果
为解决多尺度空间数据库关联更新中自动识别匹配同名地理要素的问题,以多尺度面状目标为研究对象,提出先根据小比例尺道路网约束对面状实体集进行粗匹配,再对中间结果进行几何分析和属性匹配的处理方法,建立起针对多尺度数据的关联匹配数据库,确立多尺度数据同名实体的对应关系,为多尺度数据库的一致性维护提供技术保障。实验表明,此方法的匹配效率和查全率都比传统匹配方法有了显著提升,证明了其有效性。