基于SVM和CRF双层分类器的英文电子病历去隐私化

来源 :智能计算机与应用 | 被引量 : 0次 | 上传用户:skyboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
去隐私化是2014 i2b2/UTHealth中的一个任务,目的在于识别并移除电子病历中的隐私信息。本文提出了一种基于支持向量机(SVMs)和条件随机场(CRFs)双层分类模型的去隐私化方法,经过预处理将病历文本进行词切分(tokenize)处理,并在此基础上抽取4类特征,训练SVM模型对隐私信息实体边界进行划分并将结果作为特征添加到特征集中,通过CRF训练多分类器,并通过该分类器对各个类别的隐私信息进行识别。实验表明双层分类模型对于隐私信息识别是有效的,结果 F值达到0.9110。
其他文献
在抗击新冠肺炎疫情的关键时刻,厘清疫情防控、体育助力、健康中国行动三者内在的逻辑机理,重点对体育在疫情防控中的功能价值进行梳理与分析,结合运动促进健康的治理效能,提
本论文探讨了线描教学在小学生美术课程中的重要作用及具体的教学方式方法,通过创作中线条的长短、粗细、曲直、刚柔和韵律,表现抒发儿童自己内心的意欲和情感,
《文艺新观察》为青年评论家金赫楠作推介专辑,要我谈谈对金赫楠文学批评的印象。当时未加思索就答应了,转而就有些后悔。未加思索就答应,是因为对金赫楠的批评文字还算熟悉
液压传动是机电类专业的重要专业基础课,它对理论与实践要求都较高,教学难度较大,本人在长期的教学实践中,积累了较为成熟的教学方法,运用这些方法既能较轻松的完成教学内容,又能调