一种大数据交互式挖掘框架与实现

来源 :科研信息化技术与应用 | 被引量 : 0次 | 上传用户:wtt014789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在传统的数据挖掘过程中,用户需根据专业知识对数据进行预处理,为模型设定参数后构建模型,通过评估指标判断模型是否可行。该过程的不便性体现在模型以黑盒的方式构建,用户不可见其中间过程,模型产生的结果也不易被理解。在海量数据的环境下,传统数据挖掘过程在预处理时异常数据的定位和模型生成后知识的表达方面都有不便。为了解决传统数据挖掘过程存在的问题,本文提出了一种大数据环境下的交互式数据挖掘框架。该框架使交互贯穿整个数据挖掘的过程,使得用户可以轻松定位异常输入源数据,参与模型训练过程,对模型生成的结果溯源。本文还基于Spark对该框架进行了实现,并在食源性疾病爆发预测场景下验证了其可行性。
其他文献
目的:研究膀胱癌患者外周血中树突状细胞(dendritic cells,DCs)表面B7-H1和CD8+T淋巴细胞表面PD-1的表达情况及其临床意义。方法:分离30例膀胱癌患者外周血单个核细胞(periph
21世纪终生学习的大背景下,社区教育在满足城市功能的同时也朝着精深化方向发展。大数据时代,互联网技术和移动终端的高速发展反映在社区教育上,对教学方式的创新产生了巨大
辣椒果树化栽培技术,是梓潼县农业局根据多年从事果树生产的经验、辣椒生物学特性及其栽培特点,将果树生产中的整形修剪、疏花疏果等营养调控技术与梓潼县靓绿瓜菜协会多年专业
美术教学是一种艺术教学形式,艺术本身是不断发展和创新的,所以在开展美术教学工作的过程中应该不断创新教学模式,永远都应该保持创新、尝试、探索的形式将美术的魅力传递给
解析几何是中学数学教学的难点和核心知识.但是解析几何中令人生畏的运算使得学生往往在应试中无法取得高分,难道解析几何真的这么难吗?让我们从新的视角来看看如何进行解析几何
了解中国传统装饰艺术的历史,需从“纹化”艺术开始,最初的“纹化”是石块刻划所产生的线纹,“纹化”活动的视觉思维方式为“观物取象”。对于装饰艺术的社会存在、社会价值
文章通过文献资料法、田野调查法、数理统计法等研究方法,对广西右江流域丰富的民族体育文化资源进行考察,考证了以右江流域民族体育文化为起源的右江区域民族体育文化、汉墓考
<正>1921年~1949年是中国考古学诞生和初步发展期。短短的二十多年里,虽然期间还经历了8年抗战和4年内战,但是考古学却从无到有,取得了长足的发展。笔者以为,推动这一时期考古
<正>南锣鼓巷地处故宫以北,什刹海以东,连着周边共同构成了北京历史文化遗存集中的区域,地铁公交便捷。住在这里,除了出行方便,还可以更从容地感受街头巷尾的北京风情。南锣