【摘 要】
:
针对半结构化文本的信息抽取粒度较大,不能对抽取结果进行有效语义分析的问题,面向领域提出一种基于模式匹配的结构化信息二次抽取方法。该方法以Web文档形式呈现的半结构化文
【基金项目】
:
国家自巷科学基金项目(No.60975033,60575035,60275022)资助
论文部分内容阅读
针对半结构化文本的信息抽取粒度较大,不能对抽取结果进行有效语义分析的问题,面向领域提出一种基于模式匹配的结构化信息二次抽取方法。该方法以Web文档形式呈现的半结构化文本为对象,对粗粒度抽取结果进行领域识别,根据识别结果加载相应领域词库。根据模式中各个角色的词性实现模式角色到分词序列词语的映射,从分词序列中抽取出结构化信息,为准确的语义分析提供支持。实验表明该方法能获得更准确的抽取结果。
其他文献
将隐性激励方式引入合谋理论研究,建立了公共部门组织的政府-监察者-执行单位间的三层委托代理模型,重点考察了声誉机制和监督强度对合谋合约结构的影响。研究结果表明,监察者和
传统的半监督降维技术中,在原特征空间中定义流形正则化项,但其构造无助于接下来的分类任务.针对此问题,文中提出一种自适应正则化核二维判别分析算法.首先每个图像矩阵经奇异值分解为两个正交矩阵与一个对角矩阵的乘积,通过两个核函数将两个正交矩阵列向量从原始非线性空间映射到一个高维特征空间.然后在低维特征空间中定义自适应正则化项,并将其与二维矩阵非线性方法整合于单个目标函数中,通过交替优化技术,在两个核子空
摘 要:主要市场经济国家银行业出现的集中和规模扩张演变趋势对我国国有银行改革具有重要的启示:,中国银行业改革的核心是银行产业组织效率的提升,国有银行体制转轨的路径选择应该是股权多元化的产权结构改革和放开行业管制的市场结构改革并重的综合改革。当前银行业应该全面对内资(特别是民间投资者)开放,对外资的开放须循序渐进。 关键词:银行产业组织;产权结构;市场结构;产业组织效率;路径选择 中图分类号:
本文对金融风暴来临后农民工的境遇作了阐述和分析,对近年来农民工的现状作了回顾。试图从资本和阶层两个角度对农民工所遇到的社保、失业等问题加以解读,从而为我国经济发展
股指期货的推出,大大提高了股票市场的定价效率.在无套利均衡市场上,股指期货价格由相关股票组合的价格及持有成本决定,股票现货价格成为影响股指期货价格的主要因素.但在动
科技企业孵化器的建设是推动科技成果到产业化的关键环节,为了适应科技企业孵化器快速发展壮大的需要,建立一个科学、规范和制度化的评价指标体系是十分必要的。运用信息熵筛选
本文针对计算机技术在高职院校信息化教育改革中的应用进行相应的分析以及研究。
通过引入不完整约束使不完整自然梯度算法有效克服传统自然梯度算法的缺点和不足,即当源信号幅度随时间快速变化或在某段时间为零时,不完整算法仍能较好地工作,同时,从一般动
量子计算最基本的操作就是量子态的操作,如何实现高精度、快速和对环境鲁棒性的量子态操作是目前研究的重点。量子绝热过程是一种通过操控含时哈密顿量使得量子系统沿着自身本征态演化的过程,是制备和操控量子态的常用方法。但量子绝热过程需要满足严苛的绝热条件,通常需要较长的操作时间,从而不适用于有较强退相干的环境。为了克服困难,人们提出了量子绝热捷径技术,其中一种方案称为快速准绝热过程,是把绝热条件运用到整个过
本文立足于氯化氢生产过程以及工艺原理,对其生产系统原有自动控制进行了论述,分析了原有控制方案存在的问题,针对报警装置等生产装置进行了优化设计,希望可以对氯化氢生产提供帮助。