图书自动分类技术研究与实现

来源 :软件导刊 | 被引量 : 0次 | 上传用户:nbywfcom
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出使用TF-IDF算法与朴素贝叶斯算法相结合,实现图书的自动分类。首先需从互联网中爬取图书信息,主要包括图书基本信息、图书简介、图书目录等;其次,需要对爬取到的图书信息进行预处理,将同类图书的基本信息聚在一起,并进行分词去噪;然后使用TF-IDF算法对每一类图书进行特征提取,获得每一类图书的特征;最后使用朴素贝叶斯算法,并利用训练好的分类特征,计算某本新书的具体分类。实验结果表明,该方法可以简化复杂的图书自动分类过程,提高分类效率,也能保证图书分类的准确性。
其他文献
目前300MW汽轮机滑块大多采用钢滑块结构,部分机组存在着高中压汽缸膨胀不畅问题.介绍一种自润滑滑块的性能特点,更换滑块时的工艺要点和难点以及两台300MW机组在大修中应用
青少年男子铁饼运动员身体素质训练的内容较多,其中力量训练作为身体素质训练非常重要的组成部分,对于铁饼运动员自身成绩有至关重要的影响。本文主要借助实验的方式对青少年
提升煤炭企业党建工作的时效性能够加强党对企业的领导,促进煤炭企业不断向前发展。虽然煤炭企业在党建工作上已经取得了一些成就,但是在经济发展的新形势下煤炭企业还需要继