论文部分内容阅读
摘要:文章提出了一种基于数据仓库、在线分析处理及数据挖掘的中医诊疗决策支持系统的解决方案,并结合实际应用详细讨论了中医诊疗数据仓库建立、OLAP实现的关健问题和数据挖掘的应用主题。
关键词:数据挖掘;数据仓库;在线分析处理;中医决策支持系统
目前数字中医药计划已经在我国开始实施,个体化诊疗信息平台将数字化技术引入了中医药临床研究,使我们能够采集、存储、查询大量的病例诊疗数据。传统数据分析方法是不能解决病证相关分析、辨证相关因素的发现等问题,借助OLAP技术能对数据仓库中的数据进行查询和分析,确认数据结构和趋势;借助DM技术,可以从大量原始数据中提取出有价值的、事先未知的、隐含的、潜在有用的知识。
一、中医诊疗决策支持系统的解决方案
医疗数据仓库(HISDW)是该系统的核心,为OLAP查询和数据挖掘DM提供了基础。OLAP和DM是HISDW之上的增值技术,基于HISDW的OLAP技术与DM技术的融合。
(一)中医诊疗数据仓库HISDW的建立
医生决策所使用的数据仓库可能包括来自不同医疗机构HIS的信息。一般的数据转换步骤是先进行数据清理,再进行数据合并,在HISDW的建立中,为避免数据会发生混淆,一部分数据清理工作应当在数据合并前进行。最流行的支持OLAP的数据仓库模型是多维数据模型(Multi-Dimensional OLAP),但是最符合HIS数据特点、易于支持中医诊疗OLAP和DM的数据模型是ROLAP模型,即通过比较成熟的关系型数据库构建数据仓库。中医诊疗数据的特点是信息面广、更新速度快、数据量大。病人每天病情的变化会产生大量的数据。ROLAP与MD—OLAP相较,更能适应这种数据特点:1、MD—OLAP的预综合度较高,维数的增加将使其规模迅猛增长,而ROLAP的预综合度相当灵活,可根据用户需求设置;2、MD—OLAP的预综合度较高,数据变化将产生较大的计算量;而ROLAP相当灵活,可适应较大的数据变化范围。3、ROLAP适应大数据量的能力强于MD—OLAP。
(二)OLAP的设计、实现及与DM技术的融合
诊疗OLAP与零售业、金融业典型的OLAP有很大不同。其OLAP主题涉及大量不同的属性维,可以预先汇总的主题却较少,往往要根据医务人员给出的条件灵活地进行汇总。如医生咨询的主题是:第一诊断是急性心肌梗死的患者的中医证型分布,针对这一主题,问题处理系统首先要选择属性“第一诊断”值是急性心肌梗死的患者记录,然后在这些数据子集的基础上进行分析汇总,以数据图表等直观形式提供给用户。如果HISDW有n个不同属性,所有可能的属性组合有n+c(n,2)+c(n,3)+…c(n,n),当n值很大时,很难对所有的属性组合进行预处理。为了适应在HISDW上进行灵活的OLAP分析,ROLAP中的电子病例数据库dr_emr_data应采取表1中的组织形式:
這种组织形式适应灵活的OLAP查询形式主要的个优点。一是便于构造灵活的OLAP查询。第二个优点是能提高数据访问代码的复用率。第三个优点是这种ROLAP数据组织形式,存储效率高。以冠心病诊疗为例,可以创建一棵查询树。DM所需的数据也需要进行选择,具体的选择方式与任务相关,可以从HISDW或OLAP查询结果中选取。数据挖掘的常用方法包括关联分析、分类和预测、聚类、检测离群点、趋势和演变分析等,大多数据挖掘算法是基于数据表形式,如何将表1中的数据表示形式转为将属性维收缩的二维属性关系表数据形式非常重要。
二、基于三层体系结构的中医决策支持系统框架
B/S结构与C/S结构相比有很多优点,有利于系统维护和降低系统成本,并适合医疗机构地理上分布的特点。ORACLE、DB2等大型数据库都可用于建立HISDW。ORACLE分布式数据库系统具有很多优点,提供了基于成本的智能查询优化器和良好的安全性及完整性控制机制,支持大数据库、多用户的高性能的事务处理,非常适宜于建立中医诊疗数据仓库。三层诊疗体系结构有利于地理上分散的医疗机构共享HISDW中的的信息且易于操作,是较优的医疗DSS的体系结构。
三、结束语
中医诊疗决策支持系统最重要的目标是为医务人员临床决策提供多方位的帮助,提高医疗服务的质量。本文针对中医诊疗的特点提出了融合了DW、OLAP和DM技术的解决方案,目的是为了开发出具有中医特色的高水准的诊疗决策支持系统。
参考文献:
1、Jiawei Han,Micheline Kamber.数掘挖掘概念与技术[M].中国机械工业出版社,2001.
2、Erik Thomsen(美),OLAP解决方案:创建多维信息系统(第二版)朱建秋译,电子工业出版社,2004.
3、Thomas Leonard(美),贝叶斯方法(英文版)[M].机械工业出版社,2005.
(作者单位:哈尔滨商业大学计算机与信息工程学院,作者为助理研究员)
关键词:数据挖掘;数据仓库;在线分析处理;中医决策支持系统
目前数字中医药计划已经在我国开始实施,个体化诊疗信息平台将数字化技术引入了中医药临床研究,使我们能够采集、存储、查询大量的病例诊疗数据。传统数据分析方法是不能解决病证相关分析、辨证相关因素的发现等问题,借助OLAP技术能对数据仓库中的数据进行查询和分析,确认数据结构和趋势;借助DM技术,可以从大量原始数据中提取出有价值的、事先未知的、隐含的、潜在有用的知识。
一、中医诊疗决策支持系统的解决方案
医疗数据仓库(HISDW)是该系统的核心,为OLAP查询和数据挖掘DM提供了基础。OLAP和DM是HISDW之上的增值技术,基于HISDW的OLAP技术与DM技术的融合。
(一)中医诊疗数据仓库HISDW的建立
医生决策所使用的数据仓库可能包括来自不同医疗机构HIS的信息。一般的数据转换步骤是先进行数据清理,再进行数据合并,在HISDW的建立中,为避免数据会发生混淆,一部分数据清理工作应当在数据合并前进行。最流行的支持OLAP的数据仓库模型是多维数据模型(Multi-Dimensional OLAP),但是最符合HIS数据特点、易于支持中医诊疗OLAP和DM的数据模型是ROLAP模型,即通过比较成熟的关系型数据库构建数据仓库。中医诊疗数据的特点是信息面广、更新速度快、数据量大。病人每天病情的变化会产生大量的数据。ROLAP与MD—OLAP相较,更能适应这种数据特点:1、MD—OLAP的预综合度较高,维数的增加将使其规模迅猛增长,而ROLAP的预综合度相当灵活,可根据用户需求设置;2、MD—OLAP的预综合度较高,数据变化将产生较大的计算量;而ROLAP相当灵活,可适应较大的数据变化范围。3、ROLAP适应大数据量的能力强于MD—OLAP。
(二)OLAP的设计、实现及与DM技术的融合
诊疗OLAP与零售业、金融业典型的OLAP有很大不同。其OLAP主题涉及大量不同的属性维,可以预先汇总的主题却较少,往往要根据医务人员给出的条件灵活地进行汇总。如医生咨询的主题是:第一诊断是急性心肌梗死的患者的中医证型分布,针对这一主题,问题处理系统首先要选择属性“第一诊断”值是急性心肌梗死的患者记录,然后在这些数据子集的基础上进行分析汇总,以数据图表等直观形式提供给用户。如果HISDW有n个不同属性,所有可能的属性组合有n+c(n,2)+c(n,3)+…c(n,n),当n值很大时,很难对所有的属性组合进行预处理。为了适应在HISDW上进行灵活的OLAP分析,ROLAP中的电子病例数据库dr_emr_data应采取表1中的组织形式:
這种组织形式适应灵活的OLAP查询形式主要的个优点。一是便于构造灵活的OLAP查询。第二个优点是能提高数据访问代码的复用率。第三个优点是这种ROLAP数据组织形式,存储效率高。以冠心病诊疗为例,可以创建一棵查询树。DM所需的数据也需要进行选择,具体的选择方式与任务相关,可以从HISDW或OLAP查询结果中选取。数据挖掘的常用方法包括关联分析、分类和预测、聚类、检测离群点、趋势和演变分析等,大多数据挖掘算法是基于数据表形式,如何将表1中的数据表示形式转为将属性维收缩的二维属性关系表数据形式非常重要。
二、基于三层体系结构的中医决策支持系统框架
B/S结构与C/S结构相比有很多优点,有利于系统维护和降低系统成本,并适合医疗机构地理上分布的特点。ORACLE、DB2等大型数据库都可用于建立HISDW。ORACLE分布式数据库系统具有很多优点,提供了基于成本的智能查询优化器和良好的安全性及完整性控制机制,支持大数据库、多用户的高性能的事务处理,非常适宜于建立中医诊疗数据仓库。三层诊疗体系结构有利于地理上分散的医疗机构共享HISDW中的的信息且易于操作,是较优的医疗DSS的体系结构。
三、结束语
中医诊疗决策支持系统最重要的目标是为医务人员临床决策提供多方位的帮助,提高医疗服务的质量。本文针对中医诊疗的特点提出了融合了DW、OLAP和DM技术的解决方案,目的是为了开发出具有中医特色的高水准的诊疗决策支持系统。
参考文献:
1、Jiawei Han,Micheline Kamber.数掘挖掘概念与技术[M].中国机械工业出版社,2001.
2、Erik Thomsen(美),OLAP解决方案:创建多维信息系统(第二版)朱建秋译,电子工业出版社,2004.
3、Thomas Leonard(美),贝叶斯方法(英文版)[M].机械工业出版社,2005.
(作者单位:哈尔滨商业大学计算机与信息工程学院,作者为助理研究员)