工业污染与恶性肿瘤之间的模糊关系挖掘

来源 :云南大学 | 被引量 : 0次 | 上传用户:a24287490
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机技术高速发展的今天,电子健康档案的建立使得健康医疗领域的数据呈现爆炸式增长,这为数据挖掘在健康医疗领域的应用创造了条件。根据世界卫生组织的统计,在可见的未来,恶性肿瘤发病率和死亡人数还将继续上升,为此,急需制定科学有效的防治策略。而利用数据挖掘技术对肿瘤疾病数据进行分析,挖掘出有价值的指导信息对于制定有效的防治策略尤为重要。针对挖掘恶性肿瘤与致病因素之间潜在联系这一应用场景,有以下几个重要的问题尚待解决:(1)疾病与致病因素之间的关系是模糊的;(2)疾病可能同时受多种致病因素的影响,疾病与疾病之间也存在相互影响,它们之间的关系是复杂的;(3)致病因素的影响范围如何确定;(4)挖掘得到的规则的有效性如何衡量。本文将针对上述问题展开研究。空间co-location模式挖掘是一种用于挖掘空间特征之间关联性的算法。本文基于空间co-location模式挖掘技术设计了高频繁性挖掘算法和高效用挖掘算法两种用于挖掘恶性肿瘤与致病因素之间潜在联系的算法。这两种算法都使用了基于决策表(条件属性—决策属性)的规则提取框架,将挖掘得到的co-location模式作为决策属性、污染程度作为条件属性进行规则提取,为解决疾病与致病因素之间关系的不确定性问题,引入模糊理论,提出了模糊共存度和模糊效用度的概念。在挖掘频繁co-location模式时使用了join-less算法,在挖掘高效用co-location模式时,针对现有高效用co-location模式挖掘算法普遍效率不高的问题,提出了一种基于网格划分的高效用co-location模式挖掘算法,该算法利用网格划分方法将空间数据挖掘问题转化为事务数据挖掘问题,并设计了更加紧密的效用上界进行剪枝,加快了剪枝效率,除此以外,还设计了一种迭代生成表实例的方法,减少了无用表实例的生成,通过对比实验分析证明了在本文的应用场景下,基于网格划分的高效用co-location模式挖掘算法要优于现有的算法。最后,通过在真实案例上的应用,分析了高频繁性挖掘技术和高效用挖掘技术在挖掘工业污染和恶性肿瘤之间模糊关系时的优劣。
其他文献
针对烯烃催化氧化存在能源消耗大、烯烃选择性较差的问题及聚苯胺基超级电容器循环稳定性差的问题,本论文结合埃洛石纳米管的经济、资源优势,Pickering乳液的特性,低温合成TiO2的技术,聚苯胺可见光吸收、极性可调的性质和高理论比电容的优点,MnO2的特有属性制备了埃洛石纳米管/PANI/TiO2复合材料和刻蚀埃洛石纳米管/PANI/MnO2电极材料,并分别对其烯烃光催化氧化性能和电化学性能进行了研
学位
<正>尽管多家商业银行在养老理财、养老储蓄等方面进行了有益尝试,但总体来说,商业银行发行的养老金融产品与非养老金融产品相比,养老特性不够明显,未能有效契合老龄人口金融服务和财富积累的需求,与基金、保险行业养老产品相比,在竞争力、丰富度、产品规模等方面也都存在着一定差距。商业银行应对人口老龄化的现状单设养老金部门及子公司,逐步实现养老金条线专业化经营。目前,工商银行、农业银行、中国银行等大型商业银行
期刊
基态下多种有序相和超导微观共存或竞争已成为非常规超导体具有的普遍现象,研究这些有序相与超导之间的关系对理解非常规超导机理具有重要意义。其中,过渡金属二硫族化合物2H-Nb Se2电荷密度波(CDW)和超导微观共存,这为研究CDW和超导两种有序态提供了一种理想模型。点接触安德烈夫反射谱(PCAR)作为直接探测态密度的有效工具,可分辨多带超导能隙、探测超导序参量配对对称性以及分辨能隙各向异性,因此备受
学位
乡土研学旅行基地地域特色明显,能够对全国性的研学旅行基地进行补充,从而助力研学旅行活动课程体系的完善。文章在述评研学旅行基地研究现状的基础上,以广西南宁市为例,探讨乡土研学旅行基地的遴选与课程设计。在遴选方面,可以根据课程标准及当地实际系统性地进行选择。在课程设计方面,可以结合基地实际,从课程目标、课程内容、课程总结等方面进行探讨。
期刊
电力设备缺陷描述文本是电力非结构化数据的重要组成,蕴含着丰富的电力设备健康状况信息。因此,根据电力设备缺陷的严重程度对电力设备缺陷描述文本进行快速准确的等级评价划分有助于缺陷的及时消除和检修维护工作的开展,保障电网的安全稳定运行。当前,电力设备缺陷描述由运维人员根据电力设备主要部件和对应现象标准将缺陷描述划分为其他、一般、紧急、重大四个类别,但缺陷情况的复杂多样使运维人员难以准确判定且受到不同运维
学位
近年来,智能手机、智能穿戴设备、平板电脑等各种无线终端设备进入人们的生活,人们对于移动网络通信业务的需求量呈爆发性的增长。为了确保用户获得更好的信号质量和提供更高的系统容量,异构蜂窝网络(Heterogeneous Cellular Networks,Het Net)被广泛应用和部署。尽管异构蜂窝网络的部署能够改善网络整体性能、提高容量,但是宏基站与小基站覆盖范围的重叠使得用户接收到的干扰更加复杂
学位
报纸
钙钛矿太阳能电池(Perovskite Solar Cells,PSCs)是目前在光伏领域备受瞩目的焦点之一,光电转换效率(Photoelectric conversion efficiency,PCE)超过了25%,与传统硅基太阳能电池相媲美。但由于采用了金电极及昂贵的空穴传输层(Hole Transport Layers,HTLs)材料,致使其制备成本较高,且稳定性不佳,难以实现大规模生产及商
学位
社区发现一直是分析复杂网络的一项重要而又具有挑战性的任务,目前的社区发现算法有相当一部分与网络表示学习相关。表示学习是指通过机器学习或深度学习获得网络节点,进而实现一些下游工作如聚类、节点预测。现阶段,图卷积神经网络是目前图网络学习中最为火热的领域,凭借其优异的建模能力,其性能远远超越上一代基于自然语言处理思想的深度学习模型。尽管图卷积神经网络目前发展迅速,但当其面对异质网络时仍显得难以应对。显然
学位
金属纳米颗粒(MNPs)因为具有独特的物理化学性质,在现代工业生产中被广泛应用。作为催化剂,金属纳米颗粒通常表现出比常规块体金属更好的催化活性,但其高表面能和表面原子低配位致使其在使用中趋于团聚,大大限制了其实际应用。为解决这一问题,目前广泛采用的方法是将PdNPs负载在各种有机、无机多孔材料上。有机分子笼作为一类特殊的有机多孔材料,在大多数有机溶剂中都具有较好的溶解性,且保持高度离散状态。它独立
学位