半结构化网页中多记录信息的自动抽取方法

来源 :计算机仿真 | 被引量 : 0次 | 上传用户：wangfc

【摘要】

：

从多记录网页中准确的自动抽取出需要的信息,是Web信息处理中的一个重要研究课题。针对现有方法对噪声敏感的缺点,该文提出了基于记录子树的最大相似度发现记录模式的思想,以在同类记录的表现模式存在一定差异的情况下正确识别记录。在此基础上,实现了多记录网页自动抽取系统,该系统可以从多个学术论文检索网站中,自动获取结果网页,并自动抽取其中的记录。对常见论文检索网站的实验表明了该系统具有较好的有效性和准确性。

【作者】

：

朱明王庆伟

【机构】

：

中国科学技术大学自动化系

【出处】

：

计算机仿真

【发表日期】

：

2005年12期

【关键词】

：

互联网挖掘信息集成自动信息抽取 Web mining Information integration Automatic information ext

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

网络控制系统仿真模型的网络数据传输

随着控制技术的飞速发展,把通信网络引入到传统的控制系统实现迅速准确的远距离闭环控制成为人们日益关注的课题。但是,由于通信网络的引入使得控制系统出现了许多新的特征,给传统控制理论和控制工程提出了挑战。其中,网络延迟所带来的负面影响不容忽视。对此,一般的网络控制系统仿真是在仿真模型中加入延迟环节进行分析,但这种方法往往不能真正体现实际的网络特性。该文针对网络控制系统的随机时延特性,建立一个在真实网络环

期刊

网络控制系统仿真模型网络传输Networked - control - system Simulation model Network transmi

容栅传感器及其在目标运动转台中的应用

该文采用等效电路法研究了容栅传感器的数学模型。首先具体分析了容栅传感器的基本原理,依据其原理提出了合理的等效电路。同时给出了其测量专用集成电路的逻辑框图并简单介绍了测量电路的原理。出于经济性、简便性、实用性的考虑,在该文介绍的转台控制系统中,用容栅作为位置传感器,取代原来惯用的光电编码器和电位器。在系统中通过容栅数显仪将容栅传感器测得的数据转换成RS-232串口信号,直接将转台各轴位移反馈信号送到

期刊

容栅传感器工作原理专用集成电路目标运动转台Capacitive grate transducer Principle Integrated circ

刚柔耦合控制系统仿真研究

该文介绍了交互使用有限元分析软件和控制系统仿真软件实现具有刚柔耦合结构复杂系统的仿真方法。使用有限元技术建立弹性体模型,通过二次开发语言编程实现弹性体动力响应有限元分析全过程,将计算所得的弹性体位置和速度响应以文件形式保存并传递给在控制系统仿真软件中建立的弹性体环节作为该环节的输出。同时在控制系统仿真软件中建立刚体动力特性模型以及控制器反馈模型,用C语言编程实现仿真软件调用有限元分析程序的接口,从

期刊

刚柔耦合有限元仿真Rigid-elastic coupling Finite element Simulation

振动试验仿真系统中的数据通讯实现

振动试验仿真系统是一套全数字仿真系统,由三台计算机组成,形成一个Client/Sever模式的网络体系。该文在分析了振动试验仿真系统的数据通讯要求后,设计了仿真系统数据通讯方案,采用VB的Winsock控件技术实现了客户机的数据通讯编程。采用C语言设计Winsock API网络通讯程序,在MATLAB环境下编译成M函数,直接嵌入到仿真回路中,实现了MATLAB环境下的Winsock API的无缝链

期刊

仿真数据通讯网络振动试验仿真系统Simulation Data communication Network

基于CCM符合HLA1516标准的战场仿真模型研究

该文简要介绍了从军事概念建模到完成简易的战场仿真模型的实现过程,对基于CORBA构件模型(CCM)开发符合HLA1516标准的战场仿真模型进行了初步探讨.

期刊

构件模型高层体系结构对象模型模板仿真模型

半结构化网页中多记录信息的自动抽取方法

其他学术论文