OLAP在视频网站日志分析中的应用

来源 :东华大学 | 被引量 : 2次 | 上传用户:DK7531672
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络视频已经成为继门户、搜索引擎之后又一热门互联网应用。视频网站不仅需要提供优质的视频内容和良好的用户体验,还必须具备分析运营数据的能力,从而及时做出决策。互联网环境中,信息的时效性对企业具有重要意义,因此视频网站要求分析软件能够提供实时多维分析功能,能够对视频流数据做精确地统计。本文在讨论了现有的网站分析技术之后,说明了这些技术只能对网页访问进行统计,延时较大,在时间粒度上无法提供分钟级别的分析,数据准确度不够,因此不能满足视频网站的分析需求。本文分析了视频网站分析的需求,基于数据仓库理论提出了对视频网站实时运营数据进行OLAP的解决方案。该方案首先定义了一套新的用户行为跟踪机制。该跟踪机制通过改造网站客户端,使之能将预定义的用于统计的事件发送到分析日志服务器上。该分析日志不同于传统的服务器日志,它不是对页面访问的记录信息,而是对用户行为和视频插件事件的记录,是精确分析的基础。该方案设计了一个具有实时ETL功能的数据准备区,使用分析日志根据一个有限自动状态机模型来维护用户会话集合。用户会话中含有描述网站用户的数据结构,通过每分钟对用户会话集合进行采样,能够得到最细节的基础事实数据来填充数据仓库。在数据展现区,本文按照视频网站运营者的需求定义了维度模型,并使用OLAP引擎提供最新的多维数据。由于基础事实数据以流数据形式产生,数量大,速度变化快,因此对数据仓库的更新效率和物理存储都提出了挑战。本文引入流立方体理论,分析了倾斜时间框架无法维护度量波动信息的缺点,创新地提出了基于度量波动的时间框架,给出了一个对流立方体进行部分物化的方案。实验证明该部分物化方案能在保持度量波动信息的前提下,有效缓解了数据仓库更新和存储的压力。
其他文献
随着信息技术和网络技术的飞速发展以及越来越多的网络应用,网络上的各种资源剧增,网络安全问题显得日益重要,人们对访问控制的安全性要求也在不断提高。以身份证书管理为核心的
伴随着互联网的普及,电子邮件作为一种高效、经济的现代通信技术手段,己成为互联网上最常用的应用之一。但电子邮件在给人们带来巨大便利的同时,也给人们带来了造成很大困扰
随着信息技术和计算机网络的快速发展,信息和网络系统的安全变得至关重要。继防火墙、VPN、数据加密等传统安全保护措施之后,入侵检测成为新一代的安全保障技术。作为一种主
通过计算机断层(CT)、磁共振(MR)等设备很容易获得病灶部位的二维切片图像,但是二维切片图像不能立体地显示器官组织,也不利于医生整体把握病人的病情。因此,研究和实现CT图
ICC色彩校正中的颜色匹配为同色异谱匹配,即在特定观察环境下相匹配的颜色,在改变光照后往往颜色失配。为达到物体颜色在任意光照条件下一致再现,光谱色彩校正技术应运而生。 
近年来,我国加大了医疗卫生事业的改革力度,人们的健康水平得到不断提高,因此对药品的需求也逐渐扩大,使医药市场达到一个发展高峰。众多医药销售企业已意识到提高企业管理水平的
由于传感器多样性和性能上各有千秋,多光谱与全色图像融合一直都是图像处理中研究的热点问题。随着航空遥感应用的推广,获取1幅高空间分辨率、光谱保真度的多光谱图像的需求
随着计算机技术的高速发展,机群系统应运而生。凭借其巨大的计算能力、安全的海量存储、高可扩展性的动态伸缩以及廉价的服务成本,机群系统在各个行业中得到了广泛应用。机群
OpenID标准化认证机制是新一代的单点登录解决方案,能够简化用户的操作流程、减少资源提供者认证系统的开销。OpenID的完整性保护作为多级安全的重要方面逐渐成为备受关注的
信息技术的飞速发展使得旅游信息呈爆炸式增长,面对海量的旅游资源,游客想要从中找到满足其需求的旅游信息变得日益困难;另一方面,游客的旅游观念也日益成熟和个性化,现有的旅游信