面向中文书籍的书后索引项提取

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:handong0319
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提升索引编制的准确率与效率,改善基于关键词的提取算法无法很好地提取与书籍主题相关并且具有索引价值的索引项的问题,提出综合评价方式进行书后索引项的提取。利用候选索引项在知识库中的类别和引用关系,借鉴网页排名(PageRank)算法计算候选索引项的领域重要度;对书籍内部信息进行全面分析,利用统计、位置等特征计算候选索引项的书籍内部重要度;构建综合评价模型评价候选索引项作为书后索引项的适合程度。实验结果表明,所提方法在准确率、召回率和F值方面比未改进的算法有显著提高。
其他文献
自发性面部表情视频中存在过多的冗余图像数据而在性能上遇到瓶颈,为此提出一种基于人眼视觉注意机制和协同显著性人脸特征提取算法。基于人类的视觉机制,动态提取关键帧解决面部表情的时间动态问题。通过乘法融合算法和图像协同获得关键序列帧显著区域。由于这些区域形变较小且与面部表情低相关,剔除这些显著区域,减少面部特征数据量。提取剩余面部的LBP特征,并使用SVM分类器进行分类。在Cohn-Kanade+人脸表
石家庄市北部的滹沱河两岸,20世纪60~80年代曾生长着6667hm2刺槐防护林,对护风固沙、调节气候发挥着巨大作用.然而由于上游搞水利开发,加之长期干旱和城市用水,两岸树木生长衰
乡村旅游业作为旅游业的一部分,在人民生活水平不断提高、对旅游需求不断变化的过程中愈来愈彰显出其特殊的作用,无论是对旅游业,还是对我国的经济、社会发展,乡村旅游都作出
随着网络经济的兴起,越来越多的企业开辟了网络渠道,即以网站作为销售的另一个媒介,在开拓电子市场的同时,网络空间竞争日益激烈,研究关注的焦点也从最初的消费者采纳与使用