基于主题词表和 FCA的网页语义概念树构建研究

来源 :计算机应用研究 | 被引量 : 15次 | 上传用户:liuyaping0316
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对用户使用网站效率低和网站质量差的问题,提出了利用形式概念分析(FCA)来构建网页语义概念树的方法。该方法首先利用信息抽取、自然语言处理等技术对网页集进行文本抽取、分词,提取出描述文本语义的特征词;再以主题词表为参照,设计基于搜索引擎的词语相似度算法,将抽取的特征词全部转换成主题词表中主题词,对将抽取的语义信息转换成形式背景,利用规则、聚类等技术对形式背景进行约简。最后通过设计的建格算法构建概念格,实现概念树构建。实验结果表明,利用该方法构建的概念树可以作为网站本体模型的基础,对语义评估具有积极的
其他文献
在具有多个次级用户的认知无线电网络中,资源分配问题通常需要同时考虑能效、网络编码的合作传输。针对多次级用户的资源分配问题,使用纳什议价方案建立了一种博弈。该博弈使用考虑成对策略的NBS函数和作为网络优化目标,并使用上下文环境作为约束;引入对次级用户间的双赢合作,使系统的吞吐量和公平性性能得到了改善,并基于此提出了一种高能效的次优资源分配方案。仿真结果显示,所提算法在公平性和能量效率两方面折中的性能
为解决复杂体制雷达辐射源信号特征的评价问题,提出了基于集对分析理论的复杂体制雷达辐射源信号特征分析模型。首先对复杂体制雷达辐射源信号特征评价指标体系的指标权重作层次分析,再通过集对分析理论对复杂体制雷达辐射源信号特征评估的决策矩阵进行同一度分析,最后联合指标权重矩阵和决策同一度矩阵对复杂体制雷达辐射源信号特征进行综合评判。仿真结果表明,该模型是有效、可行的,能够更好地实现对复杂体制雷达辐射源信号特
提出了一种蓝牙通信网络中基于分区的病毒传播模型。这种模型不仅考虑了蓝牙网络的连接特性、异质性、抗病毒策略等影响病毒传播的因素,同时还考虑了人类行为对病毒传播的影响,如开关设备的通用模式等。病毒的传播受到感染率、设备异质性等的影响,同时还受到使用人群的异质性的影响。通过将使用者分为不同的群,而不同群之间额相互作用与同一群内部会存在明显不同,这样就能够将在建模时引入使用者的异质性对病毒传播的影响。这种
针对云计算环境中数据的海量性和分布性特点,以及现有的分布式B树索引方法存在访问效率较低的问题,提出一种云计算环境中海量数据高效索引方法,它在分布式B树的基础之上采用日志来记录节点的分裂历史,并基于节点分裂历史高效并发访问分布式B树。实验结果表明,它有效提高了云计算环境中海量、分布式的数据访问和索引效率。
传统双模式算法中的切换时机一般采用经验确定,在迭代达到一定次数或者均方误差(MSE)降低到某一范围时硬性将算法进行切换。针对这种情况,提出了一种基于聚类技术的软判决双模式均衡算法,在不影响算法的收敛速度和精度前提下,让算法间自动进行切换,更具有实际意义和价值。该算法首先通过分析初始均衡算法输出的星座图信息,再使用减法聚类获得粗略的星座图轮廓,最后采用模糊C-均值(FCM)聚类进行二次处理,以获得精