论文部分内容阅读
摘要:心血管疾病是我国非传染类疾病死亡的主要原因,同时也给广大的患者带来严重的经济负担。为降低广大患者的经济负担,提升心血管疾病预防、诊断和治疗的效率,有必要搭建心血管疾病医疗大数据平台,实现各类心血管疾病数据采集、动态监控、共享和分析。本文从构建心血管疾病大数据的必要性、临床价值、总计技术结构以及应用情况等出发,结合云计算和人工智能等技术手段解决心血管疾病医疗大数据平台数据采集、存储、统计、分析等问题。通过该平台从一定程度上可以提升心血管疾病预防、诊断和治疗,降低患者的经济压力和医疗的支出。
关键词:心血管;大数据挖掘;医疗大数据;数据采集
【中图分类号】R714.52 【文献标识码】A 【文章编号】1673-9026(2020)07-142-02
[Abstract]Cardiovascular disease is the main cause of death of non communicable diseases in China, but also brings serious economic burden to the majority of patients. In order to reduce the economic burden of patients and improve the efficiency of cardiovascular disease prevention, diagnosis and treatment, it is necessary to build a cardiovascular disease medical big data platform to realize data collection, dynamic monitoring, sharing and analysis of various cardiovascular diseases. Starting from the necessity, clinical value, total technical structure and application of cardiovascular disease big data, this paper combines cloud computing and artificial intelligence technology to solve the problems of data collection, storage, statistics and analysis of cardiovascular disease medical big data platform. The platform can improve the prevention, diagnosis and treatment of cardiovascular disease to a certain extent, and reduce the economic pressure and medical expenditure of patients.
[Key words] Cardiovascular, big data mining, medical big data, data collection
1、引言
心血管疾病(Cardiovascular disease,CVD)为世界上死亡主要的原因[1],而中国心血管疾病的发病率和和死亡率也呈上升的趋势,据统计,目前我国非传染疾病死亡的人数占总死亡人数的71%,而其中心虚管疾病死亡人数又占非传染类级别44%,截止到2020年,心血管疾病死亡人数高达1790万,是癌症死亡人数的2倍[2]。预计到2030年,我國心血管级别死亡人数将会超过2300万且患病年龄越来越年轻化。《中国心血管病报告2017》显示,目前我国有2.9亿人患有心血管疾病,农村居民占比在45%左右[3],疾病给广大的患者经济负担日益加重,提高心虚管疾病治疗效果,降低广大患者的经济负担是目前急需解决的问题。
2019年6月6日,工信部给中国三大运营商颁发了5G牌照,标志着5G商业化正式拉开序幕[4]。5G的高流量、大带宽、低时延以及大链接技术为医疗诊断、监护、远程实时会诊等医疗领域的创新注入新的活力,同时进一步促进了大数据和人工智能的繁荣发展[5]。
本文从构建心血管疾病大数据的必要性、临床价值、总计技术结构和应用情况出发,融合云计算和人工智能技术等手段挖掘出其潜在的价值,为医生临床治疗提供支撑,为整个心血管疾病的科研提供价值支持,同时也为广大的心血管患者提供更智能的就医形式和疾病康复指导,一定程度上提升了心血管疾病预防、诊断和治疗,同时降低心血管患者的经济压力和医疗压力。
2、大数据相关概念
2.1、传统大数据及其特点
大数据从2012年开始进入大众视野,关于大数据(Big data)的定义众说不一,但集中来看可以从两个方面进行阐述:一是从技术来看:它主要是从大数据的获取、存储以及应用能力等等的数据集合;二是从管理上来看:通过数据分析和处理,挖掘出大数据蕴含巨大的潜在价值并提升数据处理的效率。
大数据的鼻祖麦肯锡公司提出大数据具有容量巨大 (Volume)、种类复杂(Variety)、处理速度快(Velocity)、价值密度低(Value)等4个特点[6]。
2.2、医疗大数据及其特点
随着科技的发展,医疗信息化在我国基本上得到全面普及,医疗数据呈指数级增长。相对传统的大数据来说,医疗大数据呈现来源广、结构复杂、价值低、专业性强等特点[7]。 来源广:医疗大数据主要涉及居民健康存档、体检、社保、诊断病例、制药等等多种数据;
结构复杂:医疗大数据具有复杂的结构,异构性广泛。医疗数据存在形式多样:有结构化数据,半结构化数据和非结构化等形式。健康档案数据、用药数据和体检数据等数据为结构化数据,可以通过数据库进行存储;病历数据、护理和手术记录等数据为半机构化数据,其主要采用文本形式进行存储;CT、内镜、影像、音频和视频等数据资料为非结构化数据。
价值低:医疗数据虽然来源广,结构复杂,但是其利用价值低。其主要原因是医疗数据信息杂乱、质量比较低,医疗数据标准还需进一步提升,挖掘困难。不过,随着大数据、云计算以及人工智能的发展,未来将会挖掘出更多医疗数据的潜在价值,真正为广大人民谋福利;
专业性强:医疗大数据主要面向广大医务人员以及从事健康产业的相关的人员,不同的疾病其专业性有不同的特点,对于数据开发人员来说具有很大的难度,因此从某种程度上也不利于医疗大数据的发展。
3、心血管医疗大数据平台的搭建
3.1心血管疾病医疗大平台搭建的必要性
目前国外针对心血管疾病的大数据平台数据比较单一,一般只通过用户的心电图信息对心血管病人的病情进行判断。如梅奥中心主要是基于心电图,然后通过人工智能实现对左心室的诊断,斯坦福大学则通过卷积神经网络来对心率失常进行检测,美国基于人工智能的美国Kardia Pro平台可以对早期房颤进行监控,法国的Cardilogs Technologies通过人工智能实现动态心电图的监控。心血管疾病的发病原因比较复杂,需通过多维数据进行综合判断和长期监控[8]。
我國目前心血管临床诊断中,不同区域和医院之间数据质量相差较大,一定程度上制约了心血管科研以及患者就医质量的提高。
心血管疾病较为复杂,主要体现在:一是随着病情的发展,心脏的形状和运动状态会有一定的变化,二是随着年龄和运动强度的变化,心肌形状也会随着改变。但是在日常诊断过程中,临床一般会用某一个统一值来进行病情判定,有时候很难区分心肌是否改变而导致潜在的疾病;另外某个参数在一定范围的时候,对于不同的民族或者个人可能存在差异,有些人可能患有心脏疾病,而有些人可能是正常。
基于上述原因有必要建立一个稳定高效的心血管大数据平台,将患者门诊、就医、体检、急救、日常穿戴设备、心血管相关的医药、健康饮食等数据形成一个信息库,融合云计算和人工智能等计算机手段,实现对心血管疾病的智能化预防、诊断和治疗。通过该平台,也可以实现全国心血管医疗资源共享,便于对所有心血管患者病情的动态监控,提升诊断和治疗效率,一定程度上可以减轻心血管病患的经济支出和国家的医疗支出。
3.2、平台总体架构
3.2.1 总体目标
搭建一个高效且平稳的心血管大数据平台,并通过云计算和人工智能等手段挖掘出潜在的价值,为医生临床治疗提供支撑,为整个心血管疾病的科研提供价值支持,同时也为广大的心血管患者提供更智能的就医形式和疾病康复指导。
3.2.2 总体框架
心血管医疗大平台除了上述目标外,还应该考虑后续研发的扩展性以及与其他相关医疗平台的接口等。其相关的总体架构如下:
整个框架分为硬件部分、数据源接口、数据采集、数据治理和存储、分析平台、应用平台以及角色等部分。
1)、基础硬件
考虑到老龄社会和心血管患者不断增加,心血管医疗大数据平台建设初期就考虑采用云计算技术,通过该技术来提升平台的安全系数,实现无穷大的大数据存储和控制,为广大的医护人员、病患提供即时访问,通过虚拟化的方式实现各医院、医疗、社区等机构间的资源共享。
2)、数据源和数据采集
数据源主要来源于居民健康档案、医疗机构、智能穿戴、日常保健和实验等数据,通过网络将相关的数据传送到大数据平台。
3)、数据处理
心血管医疗数据类型主要为结构化和非结构化数据,处理过程较为复杂,本平台采用Hadoop分布式处理的软件框架,其目的是在数据处理过程中提高可靠性、扩展性、高效性和容错率。
4)、AI分析
利用人工智能,完成图像识别、读取知识库、音频(如心电图等)等数据,然后从大数据中进行图像识别、自动推理等技术,实现对心血管医学影像、常用药物、相关营样、疾病特征等进行分析并输出相关结果。
5)、应用分析
大数据平台的应用层需提供丰富的接口,如API、PIG、HIVE以及JDBC和UDF(自定义函数)等接口,方便其他用户使用和后期扩展。
6)、角色:主要描述该平台面向的对象。该平台主要面向临床医生,医院管理人员、从事心血管疾病的研究人员、高校学生、药品/医疗机构、患者个人/家庭、社区工作者、政府决策者,以及银行、药店等等单位。
4、心血管医疗大平台应用
心血管医疗大平台建立以后,可为心血管患者、临床医生、科研、心血管疾病管理、相关的医疗/医药机构、以及政府决策者和其他相关的人员提供服务。
1)、应用于心血管患者
大多数心血管患者对疾病的起因、发展过程缺乏认识,通过该平台,可以智能引导病人进行挂号、购药、日常保健以及心血管预防。
2)、应用临床医生
临床医生通过查询患者的发病原因、就诊记录、影像和体检、用药情况、恢复情况等信息,可以综合判定病人整体情况,达到更好的对症治疗效果。同时,通过收集大量的病例样本,通过人工智能和云计算等技术,能够对不同原因引起的心血管疾病、治疗手段和效果等进行跟踪和评估,为后续临床医生在治疗过程中提供决策辅助支持。
3)、应用医院管理人员和社区人员 可以为医院管理人员在运营管理、治疗效果评估、研发投入以及生产建设等方面提供较好的决策支持;
而对应于社区人员可以了解其社区所有内心血管患者的病情状态,对患者进行一些常见保健手段和方法的宣传,一定程度上可以减少医院的就诊压力,释放一定的医疗资源。
4)、应用科研和在校学生
科研人员和在校学生可以获取大量的实践资料,缩短临床实践探索时间,同时也能够为其提供较好的实践案例和思路。
5)、应用于政府决策者
政府可以了解整个心血管疾病的起因、有效治疗手段、如何预防等,政府部门可对全民进行心血管预防宣传,组织相关的医疗机构对疑难杂症进行联合攻关等。
5 结束语
随着5G、云计算、人工智能的发展,大数据平台将在我國的医疗系统中发挥着越来越重要的作用。本文通过搭建心血管医疗大数据平台,结合云计算和人工智能等手段挖掘出潜在的价值,为医生临床治疗提供支撑,为整个心血管疾病的科研提供价值支持,同时也为广大的心血管患者提供更智能的就医形式和疾病康复指导。在整个平台搭建过程中,有一些问题还需要解决:一是目前提取的病人样例有限,需进一步扩大样例提取范围,如开放端口进行远程采集等;二是数据处理过程中,部分数据缺乏统一的标准,急需相关的医疗管理部门共同进行协商统一,以便该平台后续能够进入更好的延伸和扩张。
参考文献
[1] 胡曰波 编 .实用胸心血管外科学 [M].云南科学技术出版社,2020.7
[2] http://www.chyxx.com/industry/202006/874342.html
[3] 中国心血管病报告.2017/国家心血管病中心编著.-北京:中国大百科全书出版社,2017.12
[4]许宏金 著.5G革命:新流量时代商业方法论[M].电子工业出版社,2019
[5] 翟运开,陈庆勇,陈保站 著,翟运开,陈庆勇,陈保站 编.5G 医疗:新技术如何改变医疗产业商业模式(精装)[M]. 机械工业出版社,2020.2
[6] [英] 维克托·迈尔-舍恩伯格,[英] 肯尼思·库克耶 著,盛杨燕,周涛 译大数据时代(大数据系统研究的先河之作)[M].浙江人民出版社,2013
[7] 徐曼,沈江,余海燕 著.大数据医疗[M],机械工业出版社,2017.3
[8] 陈韵岱 著.浅谈医疗大数据与人工智能技术在心血管疾病诊疗中的应用[J].2020.8
作者简介:白玫:主任医生,本科,现任职于吉林省人民医院心内科,1998年毕业于白求恩医科大学医疗系,从事心血管内科临床与研究16年,具有丰富的经验和扎实的临床技能。
关键词:心血管;大数据挖掘;医疗大数据;数据采集
【中图分类号】R714.52 【文献标识码】A 【文章编号】1673-9026(2020)07-142-02
[Abstract]Cardiovascular disease is the main cause of death of non communicable diseases in China, but also brings serious economic burden to the majority of patients. In order to reduce the economic burden of patients and improve the efficiency of cardiovascular disease prevention, diagnosis and treatment, it is necessary to build a cardiovascular disease medical big data platform to realize data collection, dynamic monitoring, sharing and analysis of various cardiovascular diseases. Starting from the necessity, clinical value, total technical structure and application of cardiovascular disease big data, this paper combines cloud computing and artificial intelligence technology to solve the problems of data collection, storage, statistics and analysis of cardiovascular disease medical big data platform. The platform can improve the prevention, diagnosis and treatment of cardiovascular disease to a certain extent, and reduce the economic pressure and medical expenditure of patients.
[Key words] Cardiovascular, big data mining, medical big data, data collection
1、引言
心血管疾病(Cardiovascular disease,CVD)为世界上死亡主要的原因[1],而中国心血管疾病的发病率和和死亡率也呈上升的趋势,据统计,目前我国非传染疾病死亡的人数占总死亡人数的71%,而其中心虚管疾病死亡人数又占非传染类级别44%,截止到2020年,心血管疾病死亡人数高达1790万,是癌症死亡人数的2倍[2]。预计到2030年,我國心血管级别死亡人数将会超过2300万且患病年龄越来越年轻化。《中国心血管病报告2017》显示,目前我国有2.9亿人患有心血管疾病,农村居民占比在45%左右[3],疾病给广大的患者经济负担日益加重,提高心虚管疾病治疗效果,降低广大患者的经济负担是目前急需解决的问题。
2019年6月6日,工信部给中国三大运营商颁发了5G牌照,标志着5G商业化正式拉开序幕[4]。5G的高流量、大带宽、低时延以及大链接技术为医疗诊断、监护、远程实时会诊等医疗领域的创新注入新的活力,同时进一步促进了大数据和人工智能的繁荣发展[5]。
本文从构建心血管疾病大数据的必要性、临床价值、总计技术结构和应用情况出发,融合云计算和人工智能技术等手段挖掘出其潜在的价值,为医生临床治疗提供支撑,为整个心血管疾病的科研提供价值支持,同时也为广大的心血管患者提供更智能的就医形式和疾病康复指导,一定程度上提升了心血管疾病预防、诊断和治疗,同时降低心血管患者的经济压力和医疗压力。
2、大数据相关概念
2.1、传统大数据及其特点
大数据从2012年开始进入大众视野,关于大数据(Big data)的定义众说不一,但集中来看可以从两个方面进行阐述:一是从技术来看:它主要是从大数据的获取、存储以及应用能力等等的数据集合;二是从管理上来看:通过数据分析和处理,挖掘出大数据蕴含巨大的潜在价值并提升数据处理的效率。
大数据的鼻祖麦肯锡公司提出大数据具有容量巨大 (Volume)、种类复杂(Variety)、处理速度快(Velocity)、价值密度低(Value)等4个特点[6]。
2.2、医疗大数据及其特点
随着科技的发展,医疗信息化在我国基本上得到全面普及,医疗数据呈指数级增长。相对传统的大数据来说,医疗大数据呈现来源广、结构复杂、价值低、专业性强等特点[7]。 来源广:医疗大数据主要涉及居民健康存档、体检、社保、诊断病例、制药等等多种数据;
结构复杂:医疗大数据具有复杂的结构,异构性广泛。医疗数据存在形式多样:有结构化数据,半结构化数据和非结构化等形式。健康档案数据、用药数据和体检数据等数据为结构化数据,可以通过数据库进行存储;病历数据、护理和手术记录等数据为半机构化数据,其主要采用文本形式进行存储;CT、内镜、影像、音频和视频等数据资料为非结构化数据。
价值低:医疗数据虽然来源广,结构复杂,但是其利用价值低。其主要原因是医疗数据信息杂乱、质量比较低,医疗数据标准还需进一步提升,挖掘困难。不过,随着大数据、云计算以及人工智能的发展,未来将会挖掘出更多医疗数据的潜在价值,真正为广大人民谋福利;
专业性强:医疗大数据主要面向广大医务人员以及从事健康产业的相关的人员,不同的疾病其专业性有不同的特点,对于数据开发人员来说具有很大的难度,因此从某种程度上也不利于医疗大数据的发展。
3、心血管医疗大数据平台的搭建
3.1心血管疾病医疗大平台搭建的必要性
目前国外针对心血管疾病的大数据平台数据比较单一,一般只通过用户的心电图信息对心血管病人的病情进行判断。如梅奥中心主要是基于心电图,然后通过人工智能实现对左心室的诊断,斯坦福大学则通过卷积神经网络来对心率失常进行检测,美国基于人工智能的美国Kardia Pro平台可以对早期房颤进行监控,法国的Cardilogs Technologies通过人工智能实现动态心电图的监控。心血管疾病的发病原因比较复杂,需通过多维数据进行综合判断和长期监控[8]。
我國目前心血管临床诊断中,不同区域和医院之间数据质量相差较大,一定程度上制约了心血管科研以及患者就医质量的提高。
心血管疾病较为复杂,主要体现在:一是随着病情的发展,心脏的形状和运动状态会有一定的变化,二是随着年龄和运动强度的变化,心肌形状也会随着改变。但是在日常诊断过程中,临床一般会用某一个统一值来进行病情判定,有时候很难区分心肌是否改变而导致潜在的疾病;另外某个参数在一定范围的时候,对于不同的民族或者个人可能存在差异,有些人可能患有心脏疾病,而有些人可能是正常。
基于上述原因有必要建立一个稳定高效的心血管大数据平台,将患者门诊、就医、体检、急救、日常穿戴设备、心血管相关的医药、健康饮食等数据形成一个信息库,融合云计算和人工智能等计算机手段,实现对心血管疾病的智能化预防、诊断和治疗。通过该平台,也可以实现全国心血管医疗资源共享,便于对所有心血管患者病情的动态监控,提升诊断和治疗效率,一定程度上可以减轻心血管病患的经济支出和国家的医疗支出。
3.2、平台总体架构
3.2.1 总体目标
搭建一个高效且平稳的心血管大数据平台,并通过云计算和人工智能等手段挖掘出潜在的价值,为医生临床治疗提供支撑,为整个心血管疾病的科研提供价值支持,同时也为广大的心血管患者提供更智能的就医形式和疾病康复指导。
3.2.2 总体框架
心血管医疗大平台除了上述目标外,还应该考虑后续研发的扩展性以及与其他相关医疗平台的接口等。其相关的总体架构如下:
整个框架分为硬件部分、数据源接口、数据采集、数据治理和存储、分析平台、应用平台以及角色等部分。
1)、基础硬件
考虑到老龄社会和心血管患者不断增加,心血管医疗大数据平台建设初期就考虑采用云计算技术,通过该技术来提升平台的安全系数,实现无穷大的大数据存储和控制,为广大的医护人员、病患提供即时访问,通过虚拟化的方式实现各医院、医疗、社区等机构间的资源共享。
2)、数据源和数据采集
数据源主要来源于居民健康档案、医疗机构、智能穿戴、日常保健和实验等数据,通过网络将相关的数据传送到大数据平台。
3)、数据处理
心血管医疗数据类型主要为结构化和非结构化数据,处理过程较为复杂,本平台采用Hadoop分布式处理的软件框架,其目的是在数据处理过程中提高可靠性、扩展性、高效性和容错率。
4)、AI分析
利用人工智能,完成图像识别、读取知识库、音频(如心电图等)等数据,然后从大数据中进行图像识别、自动推理等技术,实现对心血管医学影像、常用药物、相关营样、疾病特征等进行分析并输出相关结果。
5)、应用分析
大数据平台的应用层需提供丰富的接口,如API、PIG、HIVE以及JDBC和UDF(自定义函数)等接口,方便其他用户使用和后期扩展。
6)、角色:主要描述该平台面向的对象。该平台主要面向临床医生,医院管理人员、从事心血管疾病的研究人员、高校学生、药品/医疗机构、患者个人/家庭、社区工作者、政府决策者,以及银行、药店等等单位。
4、心血管医疗大平台应用
心血管医疗大平台建立以后,可为心血管患者、临床医生、科研、心血管疾病管理、相关的医疗/医药机构、以及政府决策者和其他相关的人员提供服务。
1)、应用于心血管患者
大多数心血管患者对疾病的起因、发展过程缺乏认识,通过该平台,可以智能引导病人进行挂号、购药、日常保健以及心血管预防。
2)、应用临床医生
临床医生通过查询患者的发病原因、就诊记录、影像和体检、用药情况、恢复情况等信息,可以综合判定病人整体情况,达到更好的对症治疗效果。同时,通过收集大量的病例样本,通过人工智能和云计算等技术,能够对不同原因引起的心血管疾病、治疗手段和效果等进行跟踪和评估,为后续临床医生在治疗过程中提供决策辅助支持。
3)、应用医院管理人员和社区人员 可以为医院管理人员在运营管理、治疗效果评估、研发投入以及生产建设等方面提供较好的决策支持;
而对应于社区人员可以了解其社区所有内心血管患者的病情状态,对患者进行一些常见保健手段和方法的宣传,一定程度上可以减少医院的就诊压力,释放一定的医疗资源。
4)、应用科研和在校学生
科研人员和在校学生可以获取大量的实践资料,缩短临床实践探索时间,同时也能够为其提供较好的实践案例和思路。
5)、应用于政府决策者
政府可以了解整个心血管疾病的起因、有效治疗手段、如何预防等,政府部门可对全民进行心血管预防宣传,组织相关的医疗机构对疑难杂症进行联合攻关等。
5 结束语
随着5G、云计算、人工智能的发展,大数据平台将在我國的医疗系统中发挥着越来越重要的作用。本文通过搭建心血管医疗大数据平台,结合云计算和人工智能等手段挖掘出潜在的价值,为医生临床治疗提供支撑,为整个心血管疾病的科研提供价值支持,同时也为广大的心血管患者提供更智能的就医形式和疾病康复指导。在整个平台搭建过程中,有一些问题还需要解决:一是目前提取的病人样例有限,需进一步扩大样例提取范围,如开放端口进行远程采集等;二是数据处理过程中,部分数据缺乏统一的标准,急需相关的医疗管理部门共同进行协商统一,以便该平台后续能够进入更好的延伸和扩张。
参考文献
[1] 胡曰波 编 .实用胸心血管外科学 [M].云南科学技术出版社,2020.7
[2] http://www.chyxx.com/industry/202006/874342.html
[3] 中国心血管病报告.2017/国家心血管病中心编著.-北京:中国大百科全书出版社,2017.12
[4]许宏金 著.5G革命:新流量时代商业方法论[M].电子工业出版社,2019
[5] 翟运开,陈庆勇,陈保站 著,翟运开,陈庆勇,陈保站 编.5G 医疗:新技术如何改变医疗产业商业模式(精装)[M]. 机械工业出版社,2020.2
[6] [英] 维克托·迈尔-舍恩伯格,[英] 肯尼思·库克耶 著,盛杨燕,周涛 译大数据时代(大数据系统研究的先河之作)[M].浙江人民出版社,2013
[7] 徐曼,沈江,余海燕 著.大数据医疗[M],机械工业出版社,2017.3
[8] 陈韵岱 著.浅谈医疗大数据与人工智能技术在心血管疾病诊疗中的应用[J].2020.8
作者简介:白玫:主任医生,本科,现任职于吉林省人民医院心内科,1998年毕业于白求恩医科大学医疗系,从事心血管内科临床与研究16年,具有丰富的经验和扎实的临床技能。