【摘 要】
:
近年来,随着互联网技术与企业信息处理技术的快速发展,文本数据数量正在飞速增长。如何有效地从这些海量的文本数据中找到经营决策所需要的信息越来越被人们所关注。将网格计算
论文部分内容阅读
近年来,随着互联网技术与企业信息处理技术的快速发展,文本数据数量正在飞速增长。如何有效地从这些海量的文本数据中找到经营决策所需要的信息越来越被人们所关注。将网格计算与数据挖掘相结合是当前国际上的一个热门研究课题,而如何将网格计算应用于文本挖掘系统则刚刚起步。
本文主要针对基于网格计算的分布式海量文本分类系统进行了研究。首先分析比较三种传统的分类算法的性能及其适应环境,提出了基于词频、词长、词语的首现位置的综合权重算法来处理海量文本。其次,在该算法的基础上构建了基于桌面网格的海量文本分类挖掘系统以及基于网格的分布式文本数据仓库集成模型,用于存储文本数据挖掘的结果,便于数据的统计分析。最后,成功地将这些研究成果应用于电信CRM客户抱怨系统。
本文设计并实现了相关的算法与系统,并对挖掘系统的有效性进行了分析。实验结果表明,本文算法及系统的挖掘结果是令人满意的,具有较好的性能和一定的实用价值。
其他文献
另外一个人rn巨大的倒影遭遇了巨大的眼睛rn终于一百个男人遭遇了一个疯狂的rn女人rn那斜插过来的身体rn像词典中闭着眼睛的词汇rn
入冬后最大的一场雪把人封锁在屋子里,终日的忙碌被迫停下来.随着忙乱的思绪渐渐变得沉静.认真地阅读这一辑北京诗人的作品使我感动日惊喜,同时又不禁感叹,在这样一个时代能
2009年,京西北,百望山.rn幼年的我跟随父亲的步伐,在百望山的“野山”上一路攀着,到了开阔的一处,父亲举起我,高高的向更西北的方向望去,那里是中国北京航天城,我随做军官的
仁义道德的字缝里rn写满吃人rn比吃人的人多得多的rn是无论如何rn也吃不掉的rn冤魂rn
(一)隐藏 今天的相识 埋在多年前的梦里 夜是命里的更夫 众人酣睡之时 我隐藏了自己 五月,艳阳灼人 新时代的篝火 灼伤一颗怎样的心 在光阴的旮旯里 我又一次遇见自己 左手执剑 右手抚琴 (二)在路上 天气热了 家乡的杏儿也该熟了 这会儿 倦鸟也该归巢了吧 快看呐 夕阳西下时的情话,透过时光 抚摸着你的头 染白了我的发 苍天呐,我想问问你 这把赐给我的
夏天悄悄过去了rn好像什么事情都没有发生rn秋天孕育了rn她的女儿rn
数字技术的发展推动了广播电视产业的变革。本文以我国城市数字电视产业的发展为现实背景,以产业组织理论中的双边市场框架为理论基础,采用博弈分析及案例分析方法研究了城市数
安全性是工程系统的重要设计属性,大型工程系统的事故后果越来越难以被人们所接受。随着工程系统的复杂性与动态交互性的日益增加,传统的安全性分析方法已经难以全面、系统地
在IT迅速发展的背景下,敏捷性供应链成为了近年来关注的焦点.敏捷性供应链以快速响应市场需求为主要特点,千变万化的市场需求,需要IT通过对感知和响应市场变化的能力来测量对