【摘 要】
:
为了应对信息社会数据急剧增长,获得用户感兴趣或有益的数据,必须对数据进行处理,数据挖掘技术就是应这种需要而发展的.数据挖掘要取得有用数据,必须对数据进行种分类、聚类
【基金项目】
:
陇南师范高等专科学校校级科研项目“基于决策树的微博垃圾评论检测研究”(2014LSZK02006)
论文部分内容阅读
为了应对信息社会数据急剧增长,获得用户感兴趣或有益的数据,必须对数据进行处理,数据挖掘技术就是应这种需要而发展的.数据挖掘要取得有用数据,必须对数据进行种分类、聚类和关联三种不同的任务处理.对于文本信息的分类是数据挖掘的一个主要应用,而决策树算法利用自身优势和分类效率,在文本处理中有巨大的应用前景,尤其是J48算法应用与文本信息的分类有广泛的应用价值.
其他文献
2002年6月30日,从本辖区自然河道按常规取水样18份,送微生物检验室检验,其中的1份水样检出1株O139霍乱弧菌,现将检测结果报告如下.
为摸清我市某毛纺厂纺织女工视力变化情况,我们于2001年6月进行了调查,现报告如下.
在论述如何识别主位、主位方面存在分歧的基础上,探讨了主位省略的几种现象及省略的机制:语用机制、认知机制、语篇衔接机制。
家一直都是爱,温暖,宽容的代名词,而在《八月奥色治郡》这部黑色喜剧中,父亲,母亲,女儿,姐妹所有家庭成员之间只有愤怒,失望,攻击,置身于这家的家族中,是选择逃离还是循环下
影响药物疗效的因素很多,其中时间是最重要的因素之一.药物在体内的吸收、分布、代谢及排泄都与时间有着必然的联系.正确选择给药时间,合理确定给药时间间隔和停药时间,都有
2002年某化学助剂厂发生1起急性有机锡中毒事故,因当时未及时、正确处理伤口,错过了最佳抢救时机,最后导致中毒者死亡的严重后果.现将事故调查情况报告如下.
术后疼痛是机体对疾病和手术造成的组织损伤的一种复杂生理反应,它对患者的影响是多方面的,对术后恢复极为不利.随着医学科学的发展,人们已将术后镇痛视为减轻病人痛苦,提高
妊娠20周以后或分娩期,正常位置的胎盘在胎儿娩出前部分或全部从子宫壁剥离称胎盘早剥,胎盘早期剥离是致妊娠晚期出血严重的产科并发症,其特点是起病急,发病快,虽然发病率不
牡丹是中国著名的特产花卉。最早的牡丹都是野生品种,唐代开始被大量人工栽培,极大地增强了牡丹的观赏性,更形成了一股牡丹热潮。本文力图探讨牡丹由野生到栽培的驯化演变的
目的对菜青虫病毒(PrGDFV)杀虫剂进行安全性评价.方法通过对PrGDFV的急性经口LD50、急性经皮LD50、30 d致病性观察、皮肤致敏、骨髓嗜多染红细胞微核以及眼刺激实验对其进行