【摘 要】
:
为了改善文本聚类的质量,得到满意的聚类结果,针对文本聚类缺少涉及概念的内涵及概念间的联系,提出了一种基于本体相似度计算的文本聚类算法TCBO(Text Clustering Basedon Ont
【机 构】
:
安康学院电子与信息工程系,重庆教育学院科技处
【基金项目】
:
陕西省教育厅项目(09JK317), 基于本体的服务研究(AYQDZR200916), 智能信息处理技术关键问题及应用研究(2008akxy005)资助
论文部分内容阅读
为了改善文本聚类的质量,得到满意的聚类结果,针对文本聚类缺少涉及概念的内涵及概念间的联系,提出了一种基于本体相似度计算的文本聚类算法TCBO(Text Clustering Basedon Ontology)。该算法把文档用本体来刻画,以便描述概念的内涵及概念间的联系。设计和改进了文本相似度计算算法,应用本体的语义相似度来度量文档间相近程度,设计了具体的根据相似度进行文本聚类的算法。实验证明,该方法从聚类的准确性和聚类的关联度方面改善了聚类质量。
其他文献
随着P2P网络、Ad hoc、无线传感器网络的深入研究,信任和信誉成为保障这类自治网络安全的一个重要手段。虽然信任信誉系统在自治网络中起到了重要的作用,但其采用了间接推荐等
随着无线传感器网络、GPS等技术的广泛应用,产生了易变数据这种区别于传统静态数据的新型数据类型,对数据处理方法提出了新的要求。在移动计算环境中,数据广播是一种有效的数据访问方式。针对易变数据的特点提出数据平均不确定率的概念并在此基础上提出一种易变数据在线广播调度策略CEDB-M。仿真实验表明该策略在无传输差错发生、有传输差错发生和多信道广播条件下在获得较优的访问延迟的同时有效降低通过广播读取易变数
模型检查实际程序设计语言编写的程序是近年来程序验证领域的研究热点之一,出现了一批针对C,C++或Java语言的程序模型检查器原型。总结了程序模型检查中的主要问题及相关技术,以是
针对现有目标定位求解算法推导复杂和自适应粒子群算法仍存在收敛速度慢、计算量大的缺点,提出了一种基于速度自适应和变异自适应融合的改进粒子群算法。该算法在速度自适应
提出了一种基于随机Petri的服务组合间可协调性研究方法。首先,给出了服务以及服务系统的定义;然后,在服务以及服务组合可协调性定义的基础上给出了可协调行分析算法;最后,以
现今的应用程序需要更可靠的数据存储。到目前为止,数据存储的可靠性都是依靠不同的RAID级别来保证数据的可靠性,一般采用5个RAID级别中的一种。存储方面的数据已经很明显地增
不确定环境下MAS生成协作策略的复杂度关系到协作任务能否成功实现。为降低马尔可夫决策模型生成MAS协作策略的复杂度,减少协作通信量,改进了可分解MDP模型生成策略树的方法。
目前可拓变换推理中的可拓变换主要依靠历史资料、人为指定或过往经验来进行,这大大制约了可拓变换在智能化推理中的应用。为解决此问题,提出了一种基于粗糙集数据分析的可拓
无线传感器网络中的数据传输模式主要是多对一的。由于传感器节点资源严重受限、通信链路易受干扰等因素,使得拥塞问题十分严重。而传统的传输控制协议,不管是有线网络上的还是
循环并行化是OpenMP并行化程序中最重要的部分,线程数、循环体大小、调度策略等是并行化过程需要考虑的主要因素。为了在调度开销与负载均衡之间获得更好的权衡,在OMPi编译器