论文部分内容阅读
随着大数据时代的到来,传统文献采访已无法满足读者需求,现有的图书荐购方式存在盲目性、个人偏好严重、利用率不高、较被动等问题,对此,本文结合当下数据挖掘的发展背景,提出了一种基于读者行为数据分析的图书荐购模型方法。详细描述了模型的构建流程,其中,改进了本文所需的K-means挖掘算法、重点讨论了活跃书籍的挖掘过程并给出了计算方法;综合各种因素计算荐购结果中每本书的荐购指数,最后实现了一个面向采购人员的图书荐购决策支持系统,根据应用实例对研究方法进行了验证。本文的主要工作和成果如下:1.讨论了活跃书籍的挖掘过程。以高校图书馆读者行为数据为数据源,分析出影响图书活跃度的因素有被借阅次数、图书出版社、借阅者身份、被检索次数等,并给出了计算方法,使得图书特征项量化,便于后续的聚类分析比较。2.改进了K-means算法。针对活跃书籍挖掘的读者行为数据特点,本文选取了聚类算法中的K-means算法,由于传统算法的聚类结果不稳定且准确率低,本文对传统的K-means算法进行了改进,通过与其他算法的实验对比,改进后的算法使得聚类结果稳定不变,聚类结果的准确率有所提高。3.提出了一种图书荐购模型方法。该模型由挖掘活跃书籍和匹配荐购书单2个过程组成:基于上述的活跃书籍挖掘过程;利用分词、匹配等技术将活跃书籍与已有的荐购书单相结合,最终得到荐购书单。4.实现了一个图书荐购决策支持系统。基于上述图书荐购模型方法的思想,结合荐购指数的相关分析与计算方法,实现了一个图书荐购决策支持系统,可以使图书馆主动的获取读者的需求,大大地减轻了图书馆采访人员的工作量。本文所提出的基于读者行为分析的高校图书馆图书荐购方法对图书荐购方式进行了有益补充,模型验证实验证明了所提方法的有效性,满足了高校图书馆图书荐购的需求。