论文部分内容阅读
随着医学领域信息化的普及,医疗数据的生产呈指数级增长,这些医疗数据合理、高效的应用能够极大地促进医学研究、丰富医疗应用、服务人们的日常生活。病案数据是医疗数据的重要组成部分,其富含大量医学信息和研究价值,本文通过对大量医疗病案数据进行处理分析,设计一种相似病案检索系统,实现对整体病案的检索功能,系统的设计从三个方面进行。(1)病案相似性度量方面,本文设计了一种基于弱监督学习的病案相似性度量算法。首先,基于多指标概率分配的方法进行病案组的构建,避免局部最优问题;然后,根据理论模型进行标签赋值,充分利用理论知识;最后,通过对损失函数、学习模型的分析,从机器学习的角度进行病案的相似性度量。该算法综合了基于理论的检索模型和基于数据的机器学习模型,提升了病案相似性度量的精度。(2)病案聚类分析方面,本文提出了一种基于模糊关系的病案聚类算法。首先,基于Spearman相关系数对病案数据进行相关性处理,避免数据的相关性误差;然后,引入后验概率理论进行稳定性赋权,减小病案数据多源性的影响;最后,根据模糊传递闭包原理,从关系变换的角度进行病案聚类。该算法不仅提高了病案聚类的准确性,而且在一定程度上解决了病案聚类的动态性和层次性问题。(3)检索反馈优化方面,本文提出了一种基于多径反馈的病案检索优化方法。首先,基于病案检索系统的使用环境分析了系统反馈方式,并进行了总结和量化处理,提升了反馈方法的适用性;然后,针对系统的隐式间接反馈和显式直接反馈,分别提出了基于规则的标签优化反馈方法;最后,对两种反馈方法进行了组合分析。该方法从系统实际环境出发,提升了系统的适用性和检索精度,赋予了病案检索系统的自优化能力。本文的相似病案检索系统通过对病案相似性度量、病案聚类、病案检索反馈优化三个核心模块的设计,从系统的角度对模块进行整合分析,得到以病案为查询对象的病案检索系统。该系统实现了病案全文检索和相似病案整体检索的功能,多维展示了病案画像及其统计分布。不同于现有的病案检索系统,本文设计的系统实现了整体病案输入的相似病案检索,同时,病案数据信息的利用显著提升了检索精度,聚类的提出有效加快了检索速率,反馈信息的设计凸显了系统的自优化能力。该系统作为临床辅助诊断以及医学研究工具,具有较好的实际应用价值和科学研究意义。