【摘 要】
:
该文对WEB数据管理以及查询相关的技术作了较为全面的研究.主要包括WEB数据模型,XML技术,WEB数据的存储,WEB查询和WEB数据结构信息抽取,其中重点研究了WEB数据结构信息的抽取
论文部分内容阅读
该文对WEB数据管理以及查询相关的技术作了较为全面的研究.主要包括WEB数据模型,XML技术,WEB数据的存储,WEB查询和WEB数据结构信息抽取,其中重点研究了WEB数据结构信息的抽取和基于学习的WEB查询方法.该文的主要内容如下:1.归纳和总结了目前用于表示WEB数据的各种模型.2.归纳和总结了各种WEB数据的存储方法.提出了基于关系数据库存储XML文档的方法.3.总结了WEB查询语言的特点,对比介绍了目前主要的WEB查询语言.在此基础上,提出了基于学习的WEB查询方法.并详细介绍了一个基于学习的WEB查询系统FACT和对于XML文档的有监督学习查询方法.4.提出了对于半结构化数据的增量模式抽取方法,通过实验可知该方法可以有效地实现半结构化数据的结构信息抽取.
其他文献
该文根据西南交通大学CAD工程中心提出的"协同设计系统整体框架",分析了协同设计系统与通信服务模块的关系,提出了协同设计系统中的通信模块的体系结构.详细研究了IP多播传输
本文首先简要介绍了可扩展标记语言(Extensible Markup Language,简称XML),说明创建科技论文XML文档的意义与使用价值,并提出一个利用科技论文解析转换器将网上科技论文从HTML格式
该文主要为了描述电力系统,首先提出了一种非自主T时延Petri网来描述电力系统常用的延时开关.其次提出受控变速的连续Petri网(CVCPN)来描述电力系统常变频控制,负反馈控制等.
审计跟踪是系统活动的记录,这些记录足以重构、评估、审查环境和活动的次序,它是记录用户注册时间、从何处注册、要做什么的文件,这些文件也记录管理员为以后分析保存的任何其它
作者开发了计算机到计算机结的IP电话软件,比较深入地探讨了IP电话中的一些关键技术.在该文第一章简要叙述了课题背景和开发过程.第二章较为详尽地讨论了IP电话的发展、实现
该系统主要由压缩编码模块、纠错编码模块和舆流分析校验模块组成.论文主要研究内容包括MPEG-2视频压缩编码的设计,舆流在信道传输时的纠错编码方案—RS(204,188)编码器和卷
该文的主要想法是想将形式化语义方法引入工业界应用极为广泛的VerilogHDL中,为Verilog的形式化验证以及自动求精提供严格的语义基础,其主要内容包括三方面:1.该文首次给出了
随着Internet的发展,计算机软件系统的信息处理规模也呈持续增长的趋势。然而,由于传统分布计算技术的固有缺陷,软件系统却变得更庞大、缓慢和脆弱。在这种情况下,分布对象计算应
微阵列技术是实验分子生物学最新的重大突破之一,作为一个强有力的工具,它可以同时得到上千个基因的表达水平,产生大规模基因表达数据。由于在基因表达分析中有巨大的潜力,有
该文介绍了HMM的基本原理和基于HMM的语音识别方法,描述了汉语的语音学基础和识别框架,并从搜索算法的角度对连续语音识别方法进行了讨论.Viterbi搜索算法是目前比较常用的一