切换导航
文档转换
企业服务
Action
Another action
Something else here
Separated link
One more separated link
vip购买
不 限
期刊论文
硕博论文
会议论文
报 纸
英文论文
全文
主题
作者
摘要
关键词
搜索
您的位置
首页
期刊论文
正则表达式在Web信息抽取中的应用
正则表达式在Web信息抽取中的应用
来源 :北京信息科技大学学报(自然科学版) | 被引量 : 0次 | 上传用户:along365
【摘 要】
:
针对基于HTML结构的信息抽取方法,提出了正则表达式的处理方法。利用正则表达式的匹配、替换和提取等功能,重点讨论了正则表达式在Web信息抽取过程中的应用。正则表达式已成
【作 者】
:
胡军伟
秦奕青
张伟
【机 构】
:
北京信息科技大学计算机学院
【出 处】
:
北京信息科技大学学报(自然科学版)
【发表日期】
:
2011年06期
【关键词】
:
Web信息抽取
正则表达式
匹配
替换
提取
下载到本地 , 更方便阅读
下载此文
赞助VIP
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对基于HTML结构的信息抽取方法,提出了正则表达式的处理方法。利用正则表达式的匹配、替换和提取等功能,重点讨论了正则表达式在Web信息抽取过程中的应用。正则表达式已成功的应用在数据搜集、页面优化、规则学习和信息抽取等整个Web信息抽取的过程中。
其他文献
我国企业跨国并购风险成因分析
<正>美国著名企业管理机构科尔尼公司(A·T·Kearney Ltd.)根据多年的统计数据指出,只有20%的并购在事后被证实是成功的,实现了并购活动的预期目标,而其余80%的并购都以失败
期刊
企业跨国并购
风险成因分析
并购对象
海外并购
我国蔬菜生产发展的现状与对策措施
<正>蔬菜是城乡居民生活必不可少的重要农产品,保障蔬菜供给是重大的民生问题。党中央、国务院高度重视蔬菜生产和供应,社会各界广泛关注。改革开放以来,蔬菜生产发展取得了
期刊
商品化处理
生态栽培技术
集约化育苗
均衡供应
农民合作组织
农业社会化服务
现状与对策
李斯的功过与历史教训
综观李斯一生,有功有过,功大于过。其功在于:一、谏辅秦王政,作出“天下统一”的决策;二、谏阻秦王逐客,为秦王政广揽人才;三、参与重大改革,巩固奏的统一;四、提出“上农除末,黔首是富
期刊
李斯
秦始皇
胡亥
郡县制
文字改革
焚书坑儒
沙丘政变
降低锅炉排烟温度的措施及方法
分析了马鞍山发电厂SG 4 2 0 / 13.7M4 18型 2× 12 5MW机组锅炉排烟温度高的原因。通过制粉系统、燃烧系统、吹灰系统的改造以及增加炉内受热面等 ,使排烟温度降低了近 2 5
期刊
锅炉
排烟温度
制粉系统
燃烧系统
技术改造
节能降耗背景下工民建施工节能技术分析
社会经济的飞速发展,带来了严重的环境污染及资源消耗问题;在这种情况下,国家提出了节能降耗理念,工民建施工当中也需要积极利用节能技术,降低能源消耗,保护环境资源,实现可
期刊
节能降耗
工民建施工
节能技术
企业档案管理业务外包的探讨
<正>如今档案日益受到社会各界的重视,档案及相关业务也不断增长。特别是在企业档案工作加入到国际质量标准体系认证后,企业对档案工作的要求也越发严格。近几年来,不管大型
期刊
档案外包
业务外包
企业档案管理
略论打通中印公路与滇缅战场大反攻
期刊
缅北反攻战
滇西反攻战
中印公路
桃源县耕地土壤类型、分布规律及农业区划
为了进一步解放和发展农村生产力,促进桃源农业增效、农民增收和农业可持续发展,对桃源县耕地土壤类型及分布规律进行了分析,按照土壤条件、农业生产条件的类似性,以及生产特
期刊
桃源县
土壤类型
分布规律
农业区划
区域农用地经济效益评价及影响因素分析——以河南省焦作市为例
农用地经济效益评价对于优化区域土地利用结构和制定区域可持续发展政策具有重要意义。以中原经济区转型示范市焦作市为例,构建农用地经济效益评价指标体系,运用熵值-模糊综合
期刊
农用地
经济效益
熵值-模糊综合评判模型
RDA排序分析
焦作市
基于ISO26000中国对外公共投资项目社会责任风险研究
近几年,中国对外大型公共投资项目风险事件频发,引起了国内外的广泛关注。而对于中国对外公共投资项目风险研究主要从经济风险角度展开,对社会责任风险关注较少。并且国内对
学位
对外公共投资项目
社会责任风险
ISO26000六大主题
综合评价
双案例比较
与本文相关的学术论文