论文部分内容阅读
随着数字媒体技术的发展,出版资源管理信息化建设进程关系到出版事业在新时期是否具有生机与活力,并将在很大程度上决定着出版社在新时期的生存方式和发展水平。特别是美术类出版社,拥有并需要大量的图片资源,如何推进出版社图片资源管理,成为摆在出版社信息化建设过程中首要解决的核心问题,也是传统出版社向数字出版转型的重要基础。出版社,特别是美术类出版社,在蓬勃发展的数字出版技术背景下,在面向全媒体出版转型的需求背景下,在“读图时代”的社会背景下,建设面向全媒体的出版社图片资源管理系统的工作已经势在必行。本文提出的面向全媒体出版的图片资源管理系统以图片管理为切入点,建立起统一的图片管理信息系统,既可以为传统出版服务,也可以为数字出版提供便利,并在软硬件及网络环境的支持下逐步实现与互联网的互联,让美术图片资源广泛共享、多次利用,从而实现美术出版物的全媒体、多介质、个性化出版。本文以作者在出版社图片资源管理系统的开发过程为蓝本,详细阐述了出版社图片资源管理系统的开发过程和基本方法。论文首先从湖南美术出版社建设全媒体图片资源管理系统的背景出发,分析了课题研究的意义,总结了国内外有关图片资源管理系统建设、图片识别算法研究及发展现状,指出了本文的研究创新点、研究思路及方法。其次,综合分析了建设湖南美术出版社面向全媒体出版的图片资源管理系统的相关技术,包括基于文本的图片检索技术、基于K均值聚类和C均值聚类的图片识别算法、SSH技术、J2EE技术。再次,针对湖南美术出版社面向全媒体出版的图片资源管理系统进行了具体的需求分析,特别分析了以图搜图功能中的算法改进需求。此外,阐述了湖南美术出版社面向全媒体出版的图片资源管理系统的架构设计、模块设计和功能设计,强调了现有的基于C均值模糊聚类算法的图片相似度分析算法的不足,一是聚类对象需要预先人为指定聚类中心的数目,二是当初始聚类中心位置选择不合适时,算法容易收敛于局部最优解,为此本文引入遗传算法的相关理论,对以上两方面缺点依次应用遗传算法进行改进,并在此基础上提出了基于双重遗传算法的C均值模糊聚类算法(DGC-means),通过DGC算法实现了对图片识别的聚类数目与中心位置的双重优化。最后,结合已经上线运行的“湖南美术出版社美仑艺术数字资源中心”,介绍了湖南美术出版社面向全媒体出版的图片资源管理系统的功能实现,并结合DGC算法在以图搜图功能中的实现,对比了该算法与C均值算法、K均值算法的效果和性能。