基于网络爬虫的基金信息抽取与分析平台

被引量 : 0次 | 上传用户:halfmile
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的普及与发展,计算机应用作为现代社会一个不能缺少的工具已渗透到日常生活的每一个角落。在日常的计算机应用中,尤其是金融行业中基金公司的信息系统中,涉及到大量数据的处理。目前,基金公司的应用系统都是根据公司现有数据库的数据来开发应用系统。本文针对系统后台数据的获取以及系统前台数据处理进行展现,设计出基于网络爬虫的基金信息的抽取与分析平台。该系统具有良好的稳定性、可扩展性、跨平台性,不仅仅只适应于基金公司,而且只要进过简单修改就能适应于各行各业。具体工作包括系统后台的网页抓取与网页的抽取,以及系统前台J2EE三层架构设计与系统报表的实现。系统后台网页的抓取采用Heritrix网络爬虫实现,并对保存到文件系统的网页利用HTMLParser进行信息数据抽取,作为公司的数据库数据来源,能实时地获取到互联网数据,具有解决实时网络数据埋没的优点。在系统的前台是基于Hibernate、Struts、Spring开源框架搭建三层松散的J2EE架构模型,并在JSP页面中获取查询请求条件进行数据业务逻辑的处理,在前台利用Open Flash Chart、JS Chart动态生成报表,以一种直观、易理解的方式展现给用户。在对系统的需求、研究、实现的基础上,给出了基于互联网上的网页经过该系统后,展示出来的是有参考价值的数据报表模型,并在最后给出了系统的实现过程。
其他文献
目的优化肤炎清乳膏的制备工艺,以及考察肤炎清乳膏体外释放度。方法采用O/W的方法制备肤炎清乳膏并且优化其制备工艺,其次进行肤炎清乳膏与软膏的质量检查与比较,然后采用凝胶扩
以具有远程工况监控与故障诊断系统的采煤机为研究对象,主要分析了其远程工况监测系统中周围瓦斯含量等外部参数和温度等内部参数的收集和计算过程,并详细研究了采煤机故障诊
城墙在中国古建筑中享有很重要的位置,对此已有很多研究和探讨,而对城墙倒极砖方面的论述却极少。本文从施工角度出发,以城墙干摆倒极砖为例,将相关知识做了一点梳理,以供城
应用ANSYS软件提供的APDL语言对汽车起重机进行参数化建模和受力分析。通过改变模型参数实现对具有相同截面形式伸缩臂的系列化,并根据不同工况下臂架的受力情况分析出几种因
目的:研究2型糖尿病患者血清TGF—β1,Ⅳ型胶原,层粘连蛋白水平与糖尿病肾病之间的关系和对早期糖尿病肾病的诊断意义。方法:应用ELASA法测定61例2型糖尿病患者和18例健康者的血
现阶段的能源危机弊病逐渐浮现在人们视野中,同时加上资源的过度开采,全世界各个国家地区对可再生能源的开发重视程度也在不断增强。在众多可再生能源中,太阳能这种清洁、无
提高公共交通系统的运营管理水平,以更好的满足人民群众日益增长的交通出行需求、服务经济社会发展是当前公共交通领域需要解决的一个关键问题。为此,本文结合当前公共交通系
为了验证拔出法在超高强混凝土强度检测上的适用性,采用先装拔出法及后装拔出法对超高强度混凝土进行强度检测试验。试验用超高强混凝土分C120、C150、C180共3个强度等级,每