【摘 要】
:
识别海量变量间潜在的复杂关联关系,判断不同形式关联关系的强弱,是大数据关联关系挖掘的重要任务之一.然而,数据分布的不确定性、关联关系的多样性,使得基于分布假设的关联关系度量和基于数据驱动的非参数度量方法的适用性、准确性难以保证.因此,设计一种对关联关系形式无偏的有效关联度量方法变得至关重要.本文从大数据背景下潜在关联关系应被公平排序的需求出发,回顾了目前关联度量的公理化条件,给出了大数据关联关系度
论文部分内容阅读
识别海量变量间潜在的复杂关联关系,判断不同形式关联关系的强弱,是大数据关联关系挖掘的重要任务之一.然而,数据分布的不确定性、关联关系的多样性,使得基于分布假设的关联关系度量和基于数据驱动的非参数度量方法的适用性、准确性难以保证.因此,设计一种对关联关系形式无偏的有效关联度量方法变得至关重要.本文从大数据背景下潜在关联关系应被公平排序的需求出发,回顾了目前关联度量的公理化条件,给出了大数据关联关系度量可能需满足的性质;讨论了两类基于邻域视角的度量方法存在的不足;提出了本文基于k-NN粒的关联度量方法,
其他文献
2020年春,新型冠状病毒疫情爆发期间,Franke公司借助DMG MORI加工中心满足了CT扫描仪等医用设备生产对系统部件需求陡然式增长的挑战。得益于DMG MORI的DMC 125 FD duoBLOCK两台加工中心的快速交付,并结合我们自己的适配设备,才让我们保持着供应链的连续性,满足了医疗器械行业急需部件的生产。
编者按:2020年4月15日是我国第五个全民国家安全教育日,国家安全成为全社会关注的焦点。河南省审计厅党组书记、厅长汪中山参加活动并讲话,同时参加的还有有关厅领导及办公室、法规处、机关服务中心等人员。安全,对一个国家意味着强大,对一个人意味着生命。国家安全是国家生存发展的前提,是人民幸福安康的基础,是中国特色社会主义事业的重要保障。
文章结合无人机和RTK技术,将无人机及RTK获取的动态监测的数据导入Postflight Terra3D软件,形成正射影像图,然后将正射影像图导入GIS数据处理软件提取侵蚀沟面积,分析侵蚀沟变化情况。为侵蚀沟监测提供了一种较快捷、准确的方法。
在全面从严治党和依法治国的大背景下,纪检监察信访举报的积极作用得到充分显现,也随之产生了新的挑战。尤其在监察体制改革后,纪检监察机关的监督对象涵盖了所有行使公权力的公职人员,就国有企业而言,即使没有领导职务的一般管理人员也在监督范围之内,自然带来了信访举报的激增。笔者认为,在新的历史条件下,国有企业的纪检、工会等各部门应互补优势,既要加强风险研判和源头治理,努力将矛盾纠纷化解在萌芽,又要重视引导职
近年来,如何有效的加强行政事业单位财政专项资金审计以及后期的及时控制越发受到全社会的广泛关注。审计机构领导层以及现场审计人员需深入研究审计风险发生的成因,不断提高审计风险防范意识,避免审计风险的发生以达到审计积极健康发展的目的。然而在现场的实行过程中,行政事业单位审计风险的发生因素非常多,需要根据审计行为的具体情况作出判断。
新冠疫情防控期间,沁源县纪委监委组织开展了"清风读书会"活动,不断推动全体纪检监察干部在思想淬炼、政治历练、实践锻炼、专业训练上取得新进展。"五个结合"开启读书新模式。纪检监察干部将网络学习平台充分利用起来,综合采取线上学习与线下学习相结合、长期学习与短期学习相结合、八小时之内与八小时之外相结合、规定篇目与自选篇目相结合、视频学习与研讨交流相结合的办法,不断拓展学习渠道和载体,用书香充盈起大家的精
按照省人大常委会党组"不忘初心、牢记使命"主题教育工作安排,7月26日上午常委会秘书长、机关党组书记常晓春带领省人大常委会机关党员干部来到吉林省廉政教育基地,集体观看了"党风廉政建设和反腐败斗争永远在路上"主题展览并观看了警示教育专题片。
随着人工智能(artificial intelligence, AI)等新技术的引入,给光通信带来了新的活力,赋予了新的含义,形成了新的体系,构建了新的业态,受到来自学术界和工业界持续而广泛的关注与极大的研究热情.特别是将AI与已有光通信系统与网络中的光信号处理等技术相结合,可为宽带光接入、高速光传输、灵活光交换、智能光联网等性能提升和网络优化提供高效的解决方案.然而, AI在光通信中的研究与应用
集成特征选择算法将多种特征选择方法结果结合在一起,旨在得到更加有效的特征子集.然而这些算法通常假设每种特征选择方法是平等的,没有考虑不同特征选择方法性能的差异性,导致少数方法选择出的有效特征被忽略.为解决这一问题,本文提出一种可以有效地结合不同特征选择方法优势,并利用专家的知识逐步改善所选特征的交互式特征选择方法.该方法包括一个基于众包学习的集成特征选择算法和一个基于该算法开发的可视分析系统.基于
在基于深度网络的自然语言处理任务中,嵌入表示层用词向量刻画词的语义信息,可以有效地提升模型性能.词向量可以和当前任务一起端到端地进行学习,但是从模型参数数量的角度来看,词向量的训练很容易在小语料库上过拟合.为了解决这个问题,通常会使用在大语料库上预训练得到的词向量.首先,本文总结了几种常见的复用预训练词向量的方法.其次,由于当前任务的变化,会有一些新词出现,这些新词的词向量不能通过预训练的词向量获