论文部分内容阅读
随着计算机技术的发展,各个领域中的大多数文献都已数字化。本文主要使用健康文档作为原始数据,通过Web创建的健康数据,利用文本挖掘技术提取关联特征信息。使用Apriori挖掘算法,分析创建事务中的关键字的关联规则,并生成关联关键字。使用TF-C-IDF权重和关联关键字从健康数据中提取关联特征。根据在精度,召回率,F-measure和效率值方面的实验评估表明其性能很高。