基于语义扩展的数字文献自动分类方法研究

来源 :现代情报 | 被引量 : 0次 | 上传用户:mxc26
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对图书、期刊论文等数字文献文本特征较少而导致特征向量语义表达不够准确、分类效果差的问题,本文提出一种基于特征语义扩展的数字文献分类方法。该方法首先利用TF—IDF方法获取对数字文献文本表示能力较强、具有较高TF—IDF值的核心特征词;其次分别借助知网(Hownet)语义词典以及开放知识库维基百科(Wikipedia)对核心特征词集进行语义概念的扩展,以构建维度较低、语义丰富的概念向量空间;最后采用MaxEnt、SVM等多种算法构造分类器实现对数字文献的自动分类。实验结果表明:相比传统基于特征选择的短文本
其他文献
目的:分析针对良性卵巢肿瘤患者实施腹腔镜治疗的临床效果.方法:随机将良性卵巢肿瘤患者分成两组,常规组患者实施开腹手术治疗,给予治疗组患者实施腹腔镜治疗,对比两组良性卵
〔摘要〕新信息环境下微服务逐渐成为图书馆创新发展的新常态,公共服务领域的供给侧指导思想对图书馆微服务有着重要的指导意义。本文运用供给侧改革的相关理论对社交网络图书馆微服务进行分析,在图书馆服务中应该提供投入与产出的效用最大化,防止图书馆微服务供需错位,应充分利用开放获取、MOOC学习、社群经济等增加图书馆微服务的市场竞争力。  〔关键词〕图书馆;社交网络;微服务;供给侧改革  DOI:10.396
公交车司机的武侠梦上个世纪八九十年代,香港武打片风靡中国内地,影响一代又一代人走向武术殿堂的同时,也在许多少年郎心里种下了一个名叫“武侠”的梦。周杰就是备受影响的众多
〔摘要〕[目的/意义]为了帮助信息系统学者厘清媒介丰富度理论的发展脉络及其应用现状,填补国内在媒介丰富度理论相关文献综述上的缺失。[方法/過程]本文对国内外基于媒介丰富度理论的实证研究文献进行检索和梳理,归纳了当前MIS领域应用媒介丰富度理论的主要研究问题,并总结了研究取得的成果、存在的问题以及未来值得关注的研究方向。[结果/结论]研究发现:MIS领域应用媒介丰富度理论研究的文献主要集中在媒介丰富
本次的研究对象为贵阳市乌当区高雁垃圾场,对垃圾场周边天然定居的植物中的锌的含量进行调查探究。研究在该区域内常见的植物全株体内的锌的含量,筛选出对重金属锌具有很好的富
中医在我国历史悠久,具有显著治疗价值。ICU(重症监护室)是治疗危重患者的重要场所之一,集中了众多急救专业技术的医护工作人员以及先进的仪器设备等,能够利用多种监护设备对患者
目的 观察丹参粉针剂联合高压氧与高压氧治疗股骨头缺血性坏死的疗效.方法 选取2009年4月-2011年5月我院收治的成人股骨头缺血性坏死患者(均为FicatⅡ期)28例(34髋).其中15例(17髋
目的通过对2010、2011年某高校在职教工健康体检时空腹血糖结果的分析,了解该校教工的空腹血糖水平状况,为糖尿病(DM)的社区干预提供参考依据。方法 2010年某高校参加健康体检
2014年,国内第一期《新闻联播》主持人“卖萌”结尾,成为了网友和观众纷纷议论的焦点;同时,“卖萌”一词也悄然走进新闻传播领域。笔者分析新闻播报方式的转变,由“播”变为了“说
1.杏仁坚固秀发研究发现,掉发的人更易缺乏维生素B6、维E、铁和锌。另外,高脂肪饮食会造成男性雄性激素的增加,导致脱发。而杏仁中含有丰富的维生素E和锌,可以降低胆固醇,是