【摘 要】
:
通常用于评论性文本极性挖掘的方法是采用有监督的学习算法完成的,但有监督的学习算法需要大量人工标注的训练集,而且其在处理文本集时还会面临维数灾难、稀疏向量、高时空复
【机 构】
:
武汉大学信息资源研究中心,咸宁学院计算机学院
【基金项目】
:
教育部人文社会科学重点研究基地重大项目“基于智能信息处理的知识挖掘技术及应用研究”(项目编号:08JJD870225)的研究成果之一, 国家自然科学基金项目“企业竞争情报智能分析模型与方法研究”(项目编辑:71073121)
论文部分内容阅读
通常用于评论性文本极性挖掘的方法是采用有监督的学习算法完成的,但有监督的学习算法需要大量人工标注的训练集,而且其在处理文本集时还会面临维数灾难、稀疏向量、高时空复杂度、低召回率和精确率等问题而无法用于海量的文本极性分类任务。经典的K-means均值聚类算法是聚类分析中使用最为广泛的算法之一,其具有诸多的优良特性和不足。针对上述情况,本文将语义引入经典K-means均值聚类算法中,构造了专门针对中文评论文本极性判断的极性词语义词典,提出了一种基于语义准则函数的K-means均值聚类算法。这项研究是运用基于语
其他文献
针对文本聚类分析结果表达中缺乏语义关系的缺陷,本文利用人们在可视化形式下对模型和结构的理解和获取能力,提出了一种新的可视化表达方法.通过改进的Force-directed模型对
建筑工程土建施工是建筑工程建设环节中最为重要的一部分,以科学而系统的方法进行建筑工程土建施工的规范、约束和管理,是保障建筑工程整体质量的基础,同时也是保证工程功能
在“快闪”传播中国传统音乐文化的项目研究前期,笔者大致确立了传播中国传统音乐文化的“快闪”社团的创建模式。在项目的中后期研究中,笔者则将重点转移至在校园中策划人该
随着我国灾害防治技术的发展,大量公路边坡工程已得到相应的治理。为保证防护工程长期有效,大量的边坡工程将进入到关键养护期。由于边坡工程岩土特性复杂多变,破坏模式、计
<正> 小儿生长痛临床较少见,笔者自1998年以来采用脏腑按摩治疗小儿生长痛取得明显效果。1临床资料 32例患儿均为门诊病人,其中男19例,女13例;年龄最大12岁,最小3岁,其中3-10
近年来,我国城中村改造事业发展迅速,并由此产生了多种改造模式。本文从政府、村民、开发商三方结合模式出发,在分析各自效益的基础上,选取相关指标初步构建了评价城中村改造综合
随着我国经济的飞速发展,我国人口也呈现持续增长的趋势,给我国的土地资源带来很大的压力,一方面是基础建设的增加占用了一部分土地资源;另一方面是在发展的过程中对土地资源造成