论文部分内容阅读
随着传统互联网和移动通信网络的快速发展,网络带宽的提高,以及用户接入手段的多样化,基于内容提供的增值业务成为电信业务中一个关注的焦点,在这种情况下,多媒体内容成为增值的一个源泉。如何使内容能够在正确的时间、以正确的形式传递到正确的地点和人成为众多业务的核心功能之一。在很多业务平台中都要对多媒体内容进行有效管理和整合,随着多媒体内容的持续快速增长,为各个与内容提供相关的业务平台实现一套满足他们需求的内容管理系统,作为统一化的基础设施,整合复用优势内容资源,既可以降低产品整体开发成本,又能提供新的内容类业务平台的建设机会,从而在竞争中赢得先机。根据以上背景,本文设计了一个内容管理系统的存储层。为有效达到内容管理系统在海量数据的存储,以及高并发请求下,仍能快速响应用户的请求的目的,在研究了传统存储管理方式、分布式文件系统以及NoSQL,并分析了在系统中使用关系数据库将会遇到的问题后,提出了采用开源软件Hadoop作为底层分布式存储基础。为了有效组织管理内容以及提供内容相关服务,在分析现有一些系统并考虑系统的需求后采用Java内容仓库来提供内容的标准操作。综合上述,设计和实现了内容管理系统的存储层,以满足系统快速读取内容的需求。通过研究分析发现目前大部分内容管理系统采用数据库作为底层存储,以及编写SQL (Structured Query Language)语句来进行数据分析。但是数据库面临海量数据无法快速完成读写,读取时常引入额外的IO,扩展性差,以及关系表格无法灵活应对富媒体环境下的各种媒体等缺点。在考察了其它存储系统如分布式文件系统,NoSQL等系统,以及它们的可扩展性,灵活性以及经济性后,采用实现了分布式存储和分布式计算框架的Hadoop来作为底层存储。它的可扩展性好,能够存储的容量随着机器数的增加而增加,内置备份,并且它提供的分布式计算框架能够很好的用于对多媒体进行识别、检索和深入加工。为了能够很好的组织内容以及存储层向上层提供优秀的服务,本文考察了Java内容仓库,该规范中采用的树型结构灵活,规范的内容服务功能被推荐给企业应用程序来处理和管理内容,包含的操作是定义的一组内容标准操作接口,该规范已被各大厂家如IBM、ORACLE等所使用。