一种网上图书信息抽取方法

来源 :情报学报 | 被引量 : 0次 | 上传用户:zhangjianmei88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种基于竞争分类的网上图书信息抽取方法,以信息片段与样本之间的相似度作为竞争力,通过信息片段对信息模板槽的竞争来实现信息片段的分类和噪声信息的过滤,直接从分类的角度抽取图书信息。相对基于规则的信息抽取方法,在用户标记样本较少的情况下,竞争分类法更能适应数据项顺序变化较大或有数据项缺失的数据源,适用于从不同的图书数据源集成图书信息。
其他文献
国内用MARC AMC标准开发档案信息系统和WEB信息发布是个空白.本文对中国档案MARC信息组织的计算机系统进行研究,多级WEB信息检索实现了文件-案卷-类别-全宗双向的等级连接和
6月25日,金山区经委召集全区年能耗5 000tce以上重点用能单位开展节能培训。会上,金山区经委邀请区发改委、区投资促进办、市节能监察中心、市节能环保服务业协会以及通标公
借助学术期刊探讨学科结构是科学计量学的一个新兴领域,通常是通过期刊之间的引文关系来研究学科结构。而本文是从期刊的论文标题入手,探索期刊之间在研究内容上的关系并由此揭
冷冻胚胎移植是体外受精一胚胎移植的常规技术之一,但子宫内膜的准备、内膜厚度和类型、胚胎质量和数目、患者年龄、胚胎来源以及新鲜周期是否妊娠等都会影响妊娠率,均是影响冷
[摘要]目的 观察血浆脑钠肽浓度和心脏超声,心胸比随心功能改善的数值关系,探讨血浆BNP浓度对心衰病人预后判断的意义。方法 比较165例心功能不全患者治疗前、治疗后1个月及3个月的左室射血分数(LVEF)、心胸比值及BNP浓度。结果 血浆BNP水平低的患者预后好,反之预后差;并BNP水平在1个月就有变化,在3个月LVEF及心胸比才有变化。结论 BNP水平与心力衰竭患者的预后有关;并且这种变化早于心
分散式风电是未来风力发电行业的新增长点。以企业建设用地为场址的分散式风电场也将迎来空前的发展。风电场与人类活动范围越来越近,相关的风资源评估研究却很少。结合实例,
高新技术的不确定性决定了高新技术项目高风险的特征,因而,在项目立项阶段对项目所采用技术进行分析,掌握技术前景风险情况,从而有效规避风险具有重要意义。本研究应用文本挖
为寻找简便、精确的拉索拔出量计算方法,利用弹性悬链线精确解推导了张拉刚度和拉索沿两端点连线的轴向刚度计算式,对Emst等效弹性模量法、割线模量法、精确等效弹性模量法等的
建立在"信息转发假设"和"信息创新假设"的基础上,本文导出了网络信息增长的乘数扩张机制:网络信息总量Im与网络节点的平均信息创新能力A、网络的信息转发轮次数m成线性函数关
本文提出了将一种径向基网络的重要变形--概率神经网络应用于文本自动分类的研究,与常用的K-最邻近法相比,具有一定的优势,特别是在训练集中各类的训练样本数很不平衡时;与BP