数据管理和数据挖掘技术的研究和应用

来源 :北京邮电大学 | 被引量 : 4次 | 上传用户:alovey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机的普及和网络技术的不断发展,网络信息量急剧增加,从简单的文本数据到音频、视频数据,多种多样,提高了人们获取信息的种类和渠道,也很大的丰富了人们的生活内容。随着数据数量的增多、种类的扩大,人们对数据的需求的多样性也在迅速增多,对不同数据进行有效的管理的重要性就越发凸显出来,而对数据更深层次的挖掘分析所得出的规律也给生产生活带来指导性的作用。本文首先从基本的数据管理方式的角度入手,介绍了结构化数据的管理,数据库系统和数据库设计原理,着重介绍了数据库的设计范式;介绍了非结构化数据的全文索引,着重介绍了Lucene的索引结构、排序算法;并简单介绍了数据挖掘中文本挖掘的三种算法。进而利用所介绍的技术知识,结合项目内容。在Windows Server2003的操作系统环境下,设计实现了数据的管理和挖掘系统。综合描述了系统的整体结构,分别介绍了结构化数据的管理系统和非结构化数据的管理系统各个组成模块的功能和工作流程。针对文本分类模块的各种分类算法,详细的说明了数据的预处理、特征数据的提取以及分类算法的计算方式和代码实现,并实验测试了各个分类方法的性能。最后,针对系统采用的文本分类方法的特性,分析了分类器各项参数对分类器性能的影响,提出系统性能优化方案。通过实际的实验数据的分析,使得分类器的速度和分类效果有了较明显的改善,从而验证了优化方案的可行性和有效性。
其他文献
HSPA+是HSPA的向下演进版本,它针对数据业务的数据流量需求大、延迟要求低的特点,引进了一些带宽增强技术,包括MIMO技术、高阶调制,使得下行链路的单载波最高速率达到42Mbps,
随着通信与网络技术的快速发展,传统的C/S模式加单播方式来推送媒体流的流媒体服务系统由于服务器性能和网络带宽的限制。往往造成系统瓶颈。在有限的带宽实现高质量的音频、
学位
卵母细胞是雌性动物体内非常特殊的一类细胞,是哺乳动物体内最大的细胞,是产生新生命的母细胞。卵母细胞和精子结合受精便形成受精卵,然后发育成胚胎,直至生长成为新的个体。卵母
本文对Shh信号的抑制因子Sufu参与肢芽模式形成及数量进行了研究。在脊椎动物肢芽发育的过程中,其前后(AP)轴向的模式形成以及长出受到两个至关重要的信号中心所调节控制:后部
2019年11月5日, DJI大疆农业2020新品发布会在深圳举行,会上发布了全新的植保无人飞机T20.此次发布的T20每小时实际作业效率180亩/次,配置了全向避障雷达,采用点云成像,除了
期刊
红豆杉是红豆杉属(Taxus)植物的统称,属于裸子植物门红豆杉纲红豆杉科(Taxaceae)。中国有4种1变种。红豆杉能产生一种具有独特结构的二萜类次生代谢物质——紫杉醇(Taxol),具有
本文针对水下航行器(Autonomous Underwater Vehicle,AUV)的工作过程和实际应用需求,对捷联惯性导航系统(Strapdown Inertial Navigation System,SINS)及其组合导航系统在AUV领
“瑞玉”猕猴桃是以“秦美”为母本、“K56”为父本,进行杂交选育的美味系中早熟绿肉猕猴桃新品种, 2015年3月通过陕西省果树品种审定委员会审定, 2017年5月取得国家植物新品
期刊
认知网络是未来网络发展的一个重要方向,认知网络中的部分节点具有学习和推理能力,通过感知和预测网络的环境参数,实现动态决策与网元设备重构,达到适应网络环境、优化端到端