基于Agent和XML的Web页面信息抽取研究与设计

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:manhong85
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在以前相关研究的基础上,提出了一个建立在Agent和XML基础上的Web页面信息抽取的原型系统.在这个原型系统里,利用Agent的自治能力和合作能力来协助用户对抽取请求进行公式化表述和结合知识库学习抽取规则等.另外,系统还用XML语言描述抽取请求和抽取规则,在其中加入一些语义信息,这些语义信息可被有效利用,从而提高抽取的精确性.
其他文献
以贻贝为原料,用微波和超声波对贻贝中嘌呤提取工艺进行了研究,探讨了两种方法的最佳提取条件和参数。结果表明,微波辅助萃取最佳工艺参数为:液料质量比40∶1,萃取时间为20 mi
综述了聚叠氮缩水甘油醚(GAP)增塑剂及GAP粘合剂的合成方法,将GAP基粘合剂分类为GAP基热固性含能粘合剂以及GAP基热塑性含能粘合剂,其中GAP基热固性含能粘合剂主要包括了GAP
运动车辆的跟踪技术已成为目前计算机视觉研究的一个焦点问题。均值聚类和滤波预测跟踪方法常用于基于区域分割的运动车辆跟踪,但c均值聚类对初始聚类中心非常敏感,用遗传算法克服均值聚类对初始聚类中心的依赖性,遗传算法聚类数目由α-β-γ滤波的预测值确定。序列图像中帧间信息融合实现当前帧图像运动区域与信息链中的车辆关联,从而正确区分新车驶入和虚警现象。实验中有效、鲁棒地获得车辆在当前帧图像的位移等运动参数。
即时消息传递(IM--Instant messaging)是Internet上日渐普及的一种通信方法.当前有许多被使用的IM协议,但它们之间的互通性比较差.为了推动IM的进一步发展,提出了一个针对企
为给贵州省风味水豆豉工业化生产提供可选的生产菌株,从传统发酵的细菌型水豆豉中分离筛选适于豆豉生产的菌种,并对分离出的优势菌株进行产气筛选,优选出不产气的3株优势菌株
分析了并行作业调度算法,针对异构工作站群机系统(Network of Workstations,NOWs)提出了一种负载均衡的适应式划分(Adaptive Partition, AP)策略的并行调度算法,它利用了短作