【摘 要】
:
对海量数据采集与挖掘技术的问题,提出如何利用WEB文本进行多断点控制、并发采集、网上清洗等新技术方法进行海量数据采集及处理,构建了基于WEB文本海量数据挖掘的应用统计系
【机 构】
:
华南师范大学计算机学院,华南师范大学图书馆
【基金项目】
:
广东省软科学基金项目“改革开放30年广东省科技投入产出科学计量学研究”(编号:2009B070300107)的研究成果之一
论文部分内容阅读
对海量数据采集与挖掘技术的问题,提出如何利用WEB文本进行多断点控制、并发采集、网上清洗等新技术方法进行海量数据采集及处理,构建了基于WEB文本海量数据挖掘的应用统计系统,实现了三千多万条原始数据的采集、转换、统计。
其他文献
随着2013年贷款利率无下限及2015年10月存款利率无上限的政策出台,我国商业银行的利润收入由原有的“躺着挣钱”净息差收入转变为向银行各环节、各产品及各服务等多方面要效
目的探讨严重距骨骨折脱位的手术治疗总结分析.方法 26例按 Gillgust分型 12例为 II型,14例为 III型,其中 III型有8例合并距骨体骨折.手术取前内、前外二个切口,正确复位后用
本文基于多模式处理求解海洋波导的本征值与本征函数,把超越方程的搜根求解转化为展开系数矩阵的特征值分解,从而避免了传统的搜根法带来的精度低、容易漏根等问题,直接得到
分析了2005年和2006年参加图书馆新生教育的研究生来源院系的情况,并就2006年通过现场发放和网络调查的方式获得的研究生新生教育情;兑的调查问卷结果进行了分析。分析结果表明
借助SPSS16.0分析软件,利用共词聚类分析法结合类团主题粘合力,比较分析1999--2003年与2004~2008年两个时间段有关食品安全研究类团的演化、消失、新增情况,揭示近十年我国食品安
本文通过对现代茶具市场的调研和资料研究,收集了支撑论文的相关数据。对数据进行分析和查究,旨在确定目标人群和发现用户的潜在需求,建立设计指南。受到“华容道”器具智慧
在写作课堂上.常常看到这样的情景:孩子愁眉紧锁.把笔头咬烂了.也迟迟无法动笔。是生活不够丰富吗?不是的.孩子们面对的世界是五彩斑斓的。那么,是孩子们缺乏思想吗?也不是的,他们都是
头孢菌素类抗生素为一族半合成抗生素,临床实践证明,其除具有青霉素类药的抗菌作用强、毒性反应小等特点外,还具有抗菌谱广、对厌氧菌株有高效,过敏反应较少等优点.其过敏反
随着我国经济的飞速发展,网约车市场的崛起和壮大,极大地满足了人们的出行需求。作为司机和乘客出行的纽带,网约车平台通过为用户提供线上预约的方式将出行透明化、公开化。但在司乘需求中,乘客的出行需求和司机的行驶路线之间存在着较大的沟通矛盾,也成为制约网约车行业发展的重要安全隐患。对于网约车平台而言,如何以减少司乘矛盾事件、提高行业竞争力的角度,为司机规划出满足乘客出行的需求的行驶路线,是平台亟待解决的问
突发心悸是内科急诊常见症状之一,而阵发性室上性心动过速往往是致心悸的常见原因,其特点是突然发作,突然终止,所以,如能在急诊科终止其发作,可不用住院.笔者将自1993年以来