【摘 要】
:
Internet上大多数信息的表现形式为文本,如何在浩瀚的文本信息中挖掘到潜在的知识是一个有待解决的问题。文本挖掘的目的是从不同格式的文本中发现有用的知识,这是一个分析文
【机 构】
:
合肥工业大学计算机与信息学院,安徽农业大学信息与计算机学院
【基金项目】
:
安徽省高校省级自然科学研究项目(2006KJ168B)
论文部分内容阅读
Internet上大多数信息的表现形式为文本,如何在浩瀚的文本信息中挖掘到潜在的知识是一个有待解决的问题。文本挖掘的目的是从不同格式的文本中发现有用的知识,这是一个分析文本并从中抽取特定信息的过程。系统地介绍了文本挖掘的含义,并对文本挖掘过程的各个方面进行了进一步的探讨,包括文本特征的建立、特征的提取技术、文本的分类、文本的聚类等相关技术。同时提出了一种基于Web的文本信息挖掘的模型,将以高校BBS论坛为信息源,利用高级语言开发技术来构建一个自动的文本分类器。
其他文献
目的介绍紫杉醇新剂型的研究进展。方法综述近年来国内外相关报道,介绍和评价紫杉醇新剂型的制备方法、性能和药效等,指出目前紫杉醇新制剂的研究前景。结果紫杉醇新剂型可以
目的 应用氢谱核磁共振代谢组学(1H-NMR)方法研究原发性高血压合并高尿酸血症病人血清小分子代谢物代谢轮廓的变化,探讨原发性高血压合并高尿酸血症的可能发病机制。方法 选
目的探讨羞怯与非羞怯大学生的情绪调节方式及情绪调节的内隐态度。方法在武汉某高校通过羞怯量表选出羞怯大学生77名,非羞怯大学生79名,分别用情绪调节策略问卷和情绪调节版
该文报告了13例椎管内上皮样囊肿和皮样囊肿,9例位于园锥部,2例位于胸段,2例位于马尾部。其中1973—1982年有11例,占同期椎管内肿瘤的15.5%。12例经脊髓造影检查,13例均行手术
<正>党的十八届三中全会《决定》,从全面建成小康社会、实现中华民族伟大复兴中国梦的全局出发,把提高文化开放水平作为全面深化改革开放的重大任务,作出一系列战略部署。这
<正> 布氏菌病的免疫强度在6~9个月内仍然是很高的;感染后18~24个月,尚有20~25%的动物保持着诊断滴度,然后逐渐消失(血清学反应呈阴性结果)。显然,在重复感染发生以前,以及布氏