文本数据的数据挖掘算法

来源 :上海交通大学学报 | 被引量 : 0次 | 上传用户:l87521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目前大量存在的文本数据,以已有的结构化数据挖掘技术为基础,提出了非结构化数据的知识发现方法-树形分层数据库方法,对文本数据进行分析,将非结构化数据准结构化,存放入树形分层数据库中,利用已有的数据库技术以及树形分层数据库特有的一些操作,实现在知识发现过程中对数据的抽取与控制,并给出了具体的模型与过程。
其他文献
胸腔积液是恶性肿瘤最常见的并发症之一,因胸液增长快,胸液量大,严重影响患者的生活质量。尽管恶性胸腔积液的治疗方法较多,但为了探寻更好的治疗方法,我们自2004~2006-08采用中心
昆明市政府提出要力争在全市范围内推广应用新能源汽车37000辆以上,完成11000个充电桩建设,从而快速提高全市新能源汽车保有量,促进新能源汽车产业蓬勃发展。昆明市提出了对
老年急性阑尾炎是常见的外科急腹症,具有症状不典型.进展快,穿孔率高,并发症多等特点,有时并发休克及多器官功能衰竭,导致死亡。我科三年来收治老年性急性阑尾炎16例,就本组临床资料
目的:探讨贫血患者红细胞体积分布宽度的变化及其临床意义。方法:应用sysmex F-820血细胞分析仪测定164例贫血患者红细胞体积分布宽度变异系(RDW-CV)。结果:MCV↓RDW↑缺铁性贫血
针对越来越多网络应用不采用端拥塞控制机制而导致非公平占用网络带宽问题,介绍了在路由器内部实现基于连接调度的增强拥塞控制方法。路由器使用公平排队调度算法代替传统的先
目的:评价改良翼点开颅术在闭合性颅脑损伤手术中的应用价值.方法:采用改良翼点开颅术救治58例重型颅脑损伤患者,并对有关临床资料进行分析、总结.结果58例中存活53例,其中恢
<正>初中函数教学并没有给拥有特殊对称的函数以性质界定,但在几何教学中给出过轴对称和中心对称的概念.从图形上来讲,轴对称和中心对称是学生比较认可的美学特征,但是高中函
我院自1997年以来,分别选用加压滑动式鹅头钉内固定、闭合经距多根斯氏针固定、胫骨结节骨牵引的方法,共治疗转子间骨折76例,收到良好效果,现回顾分析如下。
目的:探讨肾损伤的诊断与治疗.方法:报告肾损伤42例,其中闭合性肾损伤39例,占92.8%,开放性肾损伤3例;占7.2%;合并伤15例.B超检查38例,CT检空15例,IVU检查10例.非手术治疗35例
介绍了根据胜利油田滩海地质情况的特殊性而设计的喷冲式埋缆系统的用途、组成、基本工作原理、设计过程等.该系统采取滑靴型式的喷冲挖沟方式,埋缆机由母船拖曳前进,主要用于