【摘 要】
:
科研论文头部信息和引文信息对基于域的论文检索、统计和引用分析是必不可少的.由于隐马尔可夫模型不能充分利用对抽取有用的上下文特征,因此文中提出了一种基于条件随机场的
【基金项目】
:
教育部博士点基金资助项目(20050007023)
论文部分内容阅读
科研论文头部信息和引文信息对基于域的论文检索、统计和引用分析是必不可少的.由于隐马尔可夫模型不能充分利用对抽取有用的上下文特征,因此文中提出了一种基于条件随机场的中文科研论文头部和引文信息抽取方法,该方法的关键在于模型参数估计和特征选择.实验中采用L-BFGS算法学习模型参数,并选择局部、版面、词典和状态转移4类特征作为模型特征集.在信息抽取时先利用分隔符、特定标识符等格式信息对文本进行分块,在分块基础上用条件随机场进行指定域的抽取.实验表明,该方法抽取性能明显优于基于隐马尔可夫模型的方法,且加入不同的特
其他文献
本文主要针对手风琴教学中学生普遍存在的一些问题进行探索,亦研究了教学中片面追求高难度、快进度问题,以期获得练琴的正确方法,从而帮助学生提高手风琴的演奏技巧.
建立动、静平台和伸缩杆实际误差模型的基础上,采用过约束参数识别方法,分析了高强度聚焦超声治疗机5自由度串并联机构的实际定位精度,并以3-RPS机构平台为例,进行了误差参数
在传授知识的基础上发展学生的智力是现代教学论的基本观点,而师范生智力的培养则是实现教学任务的关键.观察力是基础,记忆力是关键,思维力是核心,想象力是目的,注意力是保证
随着高校招生规模的扩大。毕业生就业难的问题已经凸显。究其原因主要是办学质量、专业设置、就业观念、就业制度、体系等方面存在许多问题,提出了以就业为导向调整专业设置;加
随着计算机及其网络化的普及,多媒体技术开始越来越多的在英语教学中被广泛应用。如何应用多媒体技术来促进当今的外语教学已经成为广大英语教师日益关心的问题。本文针对开放
公有制实现形式的多样性,既是一个理论问题,也是一个实践问题,如何认识和理解这一问题,事关改革的性质和发展方向。只有从社会主义初级阶段的实际出发,坚持“三个有利于”的标准,才
美是人们对生活的感受。只要是热爱生活的人,都会热爱美、享受美。若我们用心地去观察和感悟,将会发现有四种美:自然美、艺术美、科学美、社会美,这些美组成了有意义的人生要素。
本文将不用Cauchy中值定理而采用积分方法来证明L'Hospital法则.
邓小平在形成有中国特色社会主义理论过程中,坚持马克思历史唯物主义的基本观点,具体分析并解决社会主义建设中的矛盾和问题。他重新确立了发展生产力的原则,提出了科学技术
以实验教学为手段,多渠道、全方位培养学生分析问题与解决问题的能力,全面提高学生整体文化素质.