【摘 要】
:
基于数据的预测是当今学术和应用领域广泛关注的研究内容,很多学者提出的数据挖掘方法在一定程度上解决了预测的问题,但目前从理论上处理大数据的系统化方法还不完善。因此,本文针对大数据的数据量大的特点做了以下两方面工作:1)以具有结构特征的大数据为背景,研究了基于决策树的有放回抽样与无放回抽样相结合的分类规则获取方法(简记为SDTI)。该研究包括初始分类规则库筛选机制、分类规则库可精炼策略以及基于有放回抽
论文部分内容阅读
基于数据的预测是当今学术和应用领域广泛关注的研究内容,很多学者提出的数据挖掘方法在一定程度上解决了预测的问题,但目前从理论上处理大数据的系统化方法还不完善。因此,本文针对大数据的数据量大的特点做了以下两方面工作:1)以具有结构特征的大数据为背景,研究了基于决策树的有放回抽样与无放回抽样相结合的分类规则获取方法(简记为SDTI)。该研究包括初始分类规则库筛选机制、分类规则库可精炼策略以及基于有放回抽样的分类规则的可信性确定方法,并结合理论与实验结果分析了该方法的可行性与可解释性,为大数据背景下的分类规则获取方法提供了理论和方法支撑。2)以具有结构特征的大数据为背景,研究了基于可信性的不确定性预测方法(简记为RDP)。该研究包括RDP的执行机制与可信性的确定方法,并结合大数定律以及实验结果分析了决策属性取值分布的逼近问题,表明RDP具有良好的可解释性和可操作性,可以为大数据背景下的预测提供理论和方法支撑。因而,本文提出的模型均具有良好的可解释性和结构特征,可以帮助管理者在数据量很多的不确定环境下做出合理的决策。
其他文献
对海底管道在海床上稳定性分析的各种方法作了详尽的介绍,并对各种方法的计算结果进行了比较。
英特尔芯2合1产品搭载第四代智能英特尔酷睿TM处理器的高性能,产品吸引了消费者的眼球,面对琳琅满目的产品形态和不同的性能配置,消费者如何甄选适合自己的2合1产品呢?首先要
本研究应用理论分布模型和5个聚集强度指标,研究百山祖北坡中山常绿阔叶林多脉青冈种群分布格局。结果表明:多脉青冈种群结构呈基部和中部宽、顶部窄的形状,龄级完整,属于稳定型,
为研究原状黄土结构性随竖向荷载、含水率、吸力的变化规律,进行了非饱和黄土的侧限压缩试验,定量分析了原状黄土联结结构性参数M1与摩擦结构性参数M2,以及黄土的结构性参数M
当今已进入服务经济时代,谁能提供高品质服务,谁就能赢得企业生存发展的空间.作为金融企业的商业银行,多年来服务工作一直陷入时好时坏的境地,规范不够统一,服务不够持久,亟
目的:研究丙泊酚和七氟醚对胸腔镜手术患者围术期免疫炎症反应和血流动力学的影响。方法:选择40例择期在全身麻醉下行胸腔镜肺部疾病手术患者,ASA分级I-III级,术前心功能I-II级,年龄50-75岁,无严重阻塞性或限制性通气和(或)换气障碍、排除近2个月内服用过苯二氮卓类、免疫抑制剂、阿片类药物、有精神或者智力障碍的患者,排除恶性肿瘤TNM分期III/IV期患者,剔除双腔管插管困难及定位不良者,剔
不同尺度上景观格局与生态过程的关系是景观生态学的研究重点。根据Habit-Food-Resource范式,研究土壤养分流动与景观格局之间关系可为认识不同尺度上景观格局与生态过程的关系提供帮助。土壤侵蚀
本文从近年来桓台县域企业信用资源利用情况入手,分析县域中小企业发展过程中的融资困境,并提出重新配置、整合信用资源破解中小企业融资困境的政策建议。为便于阐述,本文所指的
哮喘是一种气道慢性炎症,以气道高反应性、黏液高分泌性和上皮下纤维化为主要特征,以支气管痉挛和可逆性气道阻塞为主要临床表现。病因和发病机制相当复杂,目前还不完全清楚。由于哮喘病因还不清楚,现有治疗手段不足,其发病率也在逐年增高,已成为严重的公共卫生问题。维生素A缺乏是一个世界性营养问题,也是目前包括我国在内的发展中国家最易缺乏的一种营养素。通过检测哮喘人群体内维生素A水平,发现哮喘患者体内,维生素A
降雨径流集存系统由集水、输水和存水三个子系统组成,它把大面积集水区的降雨径流汇集到小面积存水区的土壤水库中,变少雨为多水,是半干旱与干旱地区利用降雨径流资源发展旱作农