数据挖掘中事务性数据库的压缩及其应用

来源 :统计研究 | 被引量 : 0次 | 上传用户:daluo13613152523
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一、引言数据挖掘的首要工作是数据的准备,数据的准备包括:数据选取(Data selection)、数据预处理(Data perprocessing)和数据变换(Data transfromation).目前,我们已经充分地意识到,在信息系统中的信息积累越来越大,这样给数据的准备带来困难,给数据挖掘阶段的开采工作带来了不便.为此解决信息系统中信息量膨胀的问题,就显得尤为重要了.
其他文献
“大鹏半岛辖区内能供游艇、休闲渔船停泊的公共码头一个都没有,东山码头、南澳双拥码头都是小渔船码头,浪骑游艇会、七星湾游艇会是高档私人码头,高达数十万元的入会费与每月上
报纸
本文论述了卫星高动态扩频测控信号快速捕获的基带处理算法和具体实现,针对星载测控应答机高动态、弱信号和抗干扰的任务特点,重点讨论了捕获技术参数和快速捕获算法处理流程并
肺癌是发病率及致死率最高的恶性肿瘤。肺癌按组织病理类型可分为非小细胞肺癌(NSCLC)及小细胞肺癌(SCLC),其中前者约占肺癌的80%~90%。因肺癌患者早期无特异的临床症状,故大
命名实体识别,又称作“专名识别”,是指识别出文本中像人名、地名、组织机构名等具有特定意义的实体,它是信息抽取、问答系统和机器翻译等应用领域的重要基础工具,在自然语言
随着现代科技的迅速发展,人民逐渐享受上了较高的生活水平,大部分领域都逐渐使用上了更为舒适先进的中央空调。目前,应着时代的发展要求,PLC和单片机控制的中央空调也逐渐走
按照我国法律规定,跨国公司以直接投资进入我国市场的模式主要有三种:外商独资企业、合资企业和合作企业.表1显示了1992~2004年在华跨国公司进入模式的结构变动情况.
在设计最优控制系统时,必须首先分析出系统的可控性与可观性,利用传统的方法进行分析时,必须要进行线性代数矩阵的化简,整个过程显得比较繁琐,且容易出错,借助MATLAB软件可以