【摘 要】
:
机器学习算法的正确性依赖于训练样本,然而训练样本在标注过程中会有意或无意的带入人类的偏见,如性别、种族和宗教等敏感因素,进而得到的机器学习模型对最终用户产生歧视和偏见,这就是机器学习算法的公平性问题。随着机器学习广泛应用于人类生活,实现公平性就显得尤为重要。在金融科技领域,机器学习已经得到深度应用,然而现有的研究中很少考虑敏感属性带来的不公平性问题。本文主要考虑性别这一敏感属性进行机器学习公平性研
论文部分内容阅读
机器学习算法的正确性依赖于训练样本,然而训练样本在标注过程中会有意或无意的带入人类的偏见,如性别、种族和宗教等敏感因素,进而得到的机器学习模型对最终用户产生歧视和偏见,这就是机器学习算法的公平性问题。随着机器学习广泛应用于人类生活,实现公平性就显得尤为重要。在金融科技领域,机器学习已经得到深度应用,然而现有的研究中很少考虑敏感属性带来的不公平性问题。本文主要考虑性别这一敏感属性进行机器学习公平性研究,首先根据对现有公平性定义以及指标进行了研究分析,选出两类公平性评价指标,比较分析发现公平性指标间存在着一定的关联性,同一样本得到的两类指标分布相同。其次,在实证分析中,通过Logistic回归、支持向量机算法初步分类,利用两类公平性指标度量,验证了未进行公平性处理的分类结果确实存在着不公平。由于在实现公平性同时会在一定程度上损失准确性,为了平衡公平性和准确性,引入权衡系数λ。通过实验发现,在λ取值从0变化到1的过程中,分类准确性下降的同时公平性在提升,但过程中存在着波动,λ取值在0.2以及0.6时可实现公平性及准确率的最优权衡。本文的创新点在于验证了不同公平性指标间存在着相关性,同时将公平性学习概念应用于实际问题数据集,通过预处理的方式提出公平性逻辑回归以及公平性支持向量机算法。
其他文献
在公司治理结构中,审计委员会(AC)是保护股东利益的重要机构,在监督管理层的机会主义行为和公司治理中起着十分重要的作用。而盈余管理作为操纵盈余的一种手段,会导致上市公司所报告的盈余偏离经济收益,降低公司的盈余质量,从而损害股东及其他投资者的利益。那么审计委员会是否能够发挥其应有的监督作用,从而有效地抑制企业的盈余管理程度呢?从理论视角看,已有文献从审计委员会的独立性、专业性、勤勉性和女性任职等方面
随着我国政治体制改革不断深化,符合中国政治制度的领导干部经济责任审计在政府审计中的地位得以显现,其在监督领导干部经济责任履行情况以及规范领导干部经济行为等方面起到非常重要的作用。事业单位主要是由国家行政机关利用国有资产成立的不具有公共行政权力,但承担提供公共服务责任的公共服务机构。在我国,事业单位总体规模较为庞大并且分布在基层各个领域,其服务责任范围涉及科、教、文、卫等方面。事业单位领导干部是国家
股权结构与控制权配置一直是公司治理的核心。近些年,随着国家对于创新创业的大力推动,我国涌现出了一大批优秀的创新创业企业,并诞生了一大批优秀的企业创始人,在这些创始人的带领下这些企业为我国经济的发展和居民生活的改善起到了不可忽视的作用。但是这些企业在发展过程中引入了大量的外部资本,这些资本的加入一方面为企业的发展提供助力,另一方面导致了企业股权结构的变动,从而影响了企业控制权的配置。在此情况下,许多
经济发展道路先行,公路运输又是道路体系中非常重要的一部分,因此公路事业的高效运营对于经济发展有着极其重要的作用。为了保障公路事业的高效运营,对预算业务内部控制进行研究有着重要意义。所以本文以经费来源依赖于财政拨款的Y公路局作为研究对象,预算业务内部控制作为研究内容,两者的结合构成了全文的行文框架。本文可大致分为三个部分,分别是写作背景和理论依据、Y公路局的案例分析、结论和展望。其中最为核心和关键的
智能制造装备产业具有高附加值、产业带动性强等特征,是我国实现中国制造到“中国智造”转型的重器。2015年国家首次提出实施“中国制造2025”,随后相继出台了《中国制造2025》、《智能制造装备“十二五”发展规划》等,旨在进一步提升智能制造装备产业创新研发的水平,完善产业协同发展体系,促进智能制造装备产业发展壮大,加快从制造大国向制造强国转型。在国家大力支持下,智能制造装备产业在部分关键及核心领域获
从现实角度看,各监管部门对纵向兼任高管的经济后果及其对企业微观行为的影响各执己见。中国证券监督管理委员会对待纵向兼任高管持有充分警惕的态度,他们认为纵向兼任高管可能会发挥消极的治理作用,协助大股东获取控制权私有收益,进而掠夺上市公司的资源。证监会曾颁布文件详细规定了大股东兼任问题,包括“三分开”、“五分开”等要求规定上市公司高管不得在控股股东单位兼任。但国有资产管理部门却对纵向兼任高管总体上持积极
目前,我国正处于“三期叠加”的特殊时期,中央频繁的运用各项宏观调控政策发挥“有形之手”的作用以引导经济运行,但也使得我国整体经济政策不确定性处于较高水平。近年来,农产品期货价格在不断波动中增长,大宗商品金融化使得大宗农产品价格受宏观经济环境的影响加深。在此背景下,研究经济政策不确定性对农产品期货价格的影响对稳定农产品价格、发挥期货市场功能具有非常重要的意义。对于我国经济政策不确定性的衡量,本文采用
当矩阵数据的某些元素有缺失或者未知的情况下,在一些假设条件下将矩阵元素补齐的方法就叫做矩阵补全,目前,矩阵补全已经广泛应用于机器学习、工程学习、图像处理等相关领域。通常情况下,矩阵的缺失元素可能是任意值,矩阵补全在理论上是没有唯一解的,然而在某些假设例如低秩情况下,矩阵补全有唯一解。不同于传统的基于低秩的矩阵补全的假设,本文提出一种将基于图模型的半监督学习运用于矩阵补全的方法,而这种基于邻近信息的
近年来房地产行业实现了跨越式发展,对国民经济起到重要支撑作用的同时也助力了中国经济的腾飞。但随着房地产行业的快速扩张,日益高涨的房价成为了社会各界的关注热点,我国政府也相继出台了多项政策来对房价进行控制。为了确保宏观政策调控的合理性,这需要对整个房地产行业进行更为科学有效的分析。以前有关于房价的研究大多假定不同省份之间的房价在空间分布上是相互独立的,忽略了空间依赖性和空间异质性的存在,且研究对象集
本翻译报告的源文本为美国于2018年颁布的《青少年司法改革法》。该法是针对1974年《美国少年司法和犯罪预防法案》的修订案,其目的是改善美国的少年司法制度并降低少年犯罪率。在本法出现了大量复杂的长句。笔者在翻译时发现,在保证译文准确性的同时又不会使译文显得累赘冗杂是十分困难的。因此,本翻译报告主要探讨在《青少年司法改革法》(2018年)中长句的翻译技巧。笔者在翻译长句时采用的翻译技巧有:顺译法、倒