基于异构中文在线百科的层次话题构建

来源 :计算机科学 | 被引量 : 0次 | 上传用户:deboywang126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文在线百科包含大量有价值的信息,很多工作成功地将其用于各类知识获取任务。例如,拥有相似话题的文档可以被归为一个概念。从这些在线百科中构建出的针对某一概念的层次话题对于搜索与浏览、信息组织和检索等应用都有很大的帮助。然而,目前尚未出现对在线百科中某一概念层次话题构建的研究。针对中文在线百科的异构性与粗糙性的问题,提出了一种基于贝叶斯网络的话题层次构建方法。该方法同时综合文档的结构化目录信息和非结构化文本信息,采用最大树形图算法自动地在文档所属概念的贝叶斯话题网络中建立层次话题。实验证明,与原有的百科话题结
其他文献
通过综合考虑集合中元素的隶属度、非隶属度和犹豫度,定义了直觉模糊信息系统的加权得分函数。基于此得分函数,定义了直觉模糊信息下的优势关系,运用“逻辑且”的方式将变精度粗
PC/104总线秉承了许多IBM-PC开放式总线结构的优点,针对列车运行的特点和安全性的要求,设计了基于PC/104总线的列车运行监控系统,给出了列车运行监控系统的基本组成和软件结构设计
消息认证码(MAC)是保证信息完整性传输的重要手段,目前已广泛应用于各种安全系统中。iPMAC和VPMAC由于其平行的结构模式成为了消息认证码的典型代表。而iPMAC和VPMAC是否存在新
针对百度外卖行业具有的客户数量大、消费数据多、维度多等特点,提出一种基于客户消费行为视角的改进RFM模型。采用层次分析算法确定模型中各个变量的权重,并在此基础上采用K
稀疏矩阵向量乘(Sparse matrix-vector multiplication,SPMV)是广泛应用于大规模线性求解系统和求解矩阵特征值等问题的基本运算,但在迭代处理过程中它也常常成为处理的瓶颈,影
针对电子、汽车等行业中普遍存在的第2类U型装配线平衡问题(UALBP-2),提出了一种双阶段蚁群算法。强调全局搜索的第一阶段算法利用探路蚁,根据操作选择和分配策略以及迭代压缩
安全的信息共享对信息系统而言至关重要。协作环境下的关键应用对信息共享和信息安全提出了更高的要求。已有的基于BLP模型的强制访问控制模型均无法满足协作环境下关键应用
将业务流程模型抽象中的行为聚合解释为一个半监督聚类过程,利用基于试探的启发式方法选择合适的行为集合作为初始簇,进而提高抽象的质量。另外,为了同时满足模型转换的保序性需
针对传统的相似度计算方法和评价标准在准确、高效地度量微博用户相似关系时不理想的缺陷,提出一种新的微博用户相似度的计算方法。该方法针对不同的属性数据结构采用不同的
异常检测是系统运行维护的重要工作。在系统运行过程中可获得大量正常的运行数据,但异常数据的获取成本较高,因此可引入单分类器的思想来处理异常检测问题。测量不确定性、环