基于LDA主题模型的病症分析系统设计与实现

来源 :河北工程大学 | 被引量 : 0次 | 上传用户:zhuzi1976
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
医疗是一个为全民提供服务的行业。随着医疗数据日益丰富,为充分利用医疗文本数据,从中获取有价值的信息,并将其运用到实际生活中,是医疗行业顺应时代发展的需要。本文利用主题模型对病症文本数据进行深入分析,构建病症知识库实现病症问答分析,有助于患者根据自身病症了解所患疾病,辅助医生进行临床决策,为分析病症发展趋势以及自主诊断等提供技术支撑。研究内容如下。(1)针对病症文本数据中不同词性的重要度存在差异的问题,提出根据词性设置不同的贡献权重。首先,构建医疗专业词汇分词词典;然后,对病症文本数据进行筛选、中文分词、词性标注和去停用词;最后,根据相应词性,对全局向量模型(Global Vectors for Word Representation,简称Glo Ve)建模后的词向量进行词性贡献权重标注,进而计算病症文本向量。(2)针对K-Medoide聚类算法在计算相似度时准确率不高的问题,提出基于隐含狄利克雷分布(Latent Dirichlet Allocation,简称LDA)主题模型的病症文本聚类算法(LG&K-Medoide),采用LDA和Glo Ve相似度结合改进距离函数的方法,获取科室主题聚类。首先,利用LDA建模病症文本,采用JS距离(Jensen–Shannon,简称JS)计算文本相似度;其次,使用Glo Ve建模获取词向量,根据病症词性贡献度标注词向量权重,采用余弦距离计算基于Glo Ve建模加权的文本相似度;最后,利用相似度结合改进距离公式,优化K-Medoide聚类。(3)针对现有病症分析系统模式单一的问题,搭建基于LDA主题模型的病症分析系统。首先,对病症分析系统进行需求分析和框架设计;然后,构建包含疾病、症状、科室、药物、检查方法等实体间关系的病症知识库;其次,搭建疾病症状分析、科室病症分析和病症问答分析等可视化界面;最后,提取My SQL数据库中的病症文本和检索Neo4j图数据库中的答案进行分析展示,从而实现病症分析和病症问答功能。综上,本文提出的基于LDA主题模型的病症文本聚类算法在病症文本数据集上具有更高的聚类精度;搭建的基于LDA主题模型的病症分析系统,能够帮助患者随时根据自身病症得到相应的指导意见,为主题模型聚类在医疗分析领域的应用奠定了基础,为自主病症诊断提供了新思路。
其他文献
本文通过在传统轴承钢GCr15的基础上,添加了合金元素Si、Mo以及微合金元素V,设计出微合金化轴承钢GCr15Si1Mo V。对设计出的新型轴承钢分别在Ms温度附近进行等温处理,得到了等温马氏体与低温贝氏体组织,并在原热处理基础上提高奥氏体化温度至1100℃,以分析不同奥氏体化温度对实验钢性能的影响。利用扫描电镜(SEM)实验与X射线衍射(XRD)实验,对热处理后实验钢的微观组织进行表征,并结合
学位
无碳化物贝氏体钢因其优异的综合力学性能有望应用于工程机械、轨道交通、桥梁建筑等领域。但通过传统的Ms点以上等温淬火工艺制备高碳纳米贝氏体钢时间周期长,并且较高的碳含量使其焊接性能较差,降低碳含量又会使钢的强度指标降低。因此,本文通过合金成分调整和热处理工艺优化的方法,设计了两种碳含量不同(0.22C和0.45C)的合金钢,对两种合金钢进行Ms点以上及以下等温淬火处理。利用OM、SEM、TEM和XR
学位
滚动轴承作为旋转机械的重要组成部件之一,其运行状态直接影响着整个机械设备的运转甚至人身安全,因此对轴承进行故障诊断分类具有重要的现实意义。本文以轴承的故障特征提取和故障诊断模型等两个角度入手,提出ICEEMDANHilbert边际谱-DSELMCAE与IAO-SVM模型结合的滚动轴承故障诊断方法。首先,针对轴承振动信号的非线性、非平稳性等特性造成故障特征难以提取的问题,采用ICEEMDAN算法分解
学位
矿井安全支护中梯子梁需求量大、焊接质量要求高。但是传统的梯子梁具有焊接过程复杂,人工焊接效率低、焊接质量参差不齐、生产成本高等缺点。针对上述问题,本文基于一种新型U型梯子梁结构,设计出了一套自动化生产线,实现新型梯子梁的自动化高质量生产。分析生产线设计难点,设计规划出新型梯子梁生产线的总体方案。利用ANSYS Workbench平台进行新型梯子梁与传统梯子梁残余应力与位移的数值模拟,验证了新型梯子
学位
双辊薄带连铸技术能直接将高温金属液进行连铸与轧制,相较于传统工艺,通过此工艺制造出的金属薄带坯具有更细小的晶粒,更均匀的分布组织,更低的元素偏析,更优良的物理性能。双辊薄带连铸铜合金技术涉及了传热学、流体力学、凝固及热变形等多门学科多个领域,薄带连铸过程中工艺参数发生任何微小的改变或不稳定的变化都有可能致使成品薄带出现严重的缺陷,而目前薄带连铸铜合金的研究尚不深入,不同工艺参数下溶池温度场、流场、
学位
作为未来汽车的发展方向之一,智能车辆及其关键技术是科研人员重点研究的领域。环境感知是智能车辆最基础的关键技术,为智能车辆提供了精确的道路场景信息。交通标线检测是智能车辆环境感知的重点内容,交通标线的种类繁多,主要包括车道线和地面交通标志。本文采用基于改进U-Net和YOLOv5s的算法对车道线和地面交通标志进行检测与研究。基于语义分割方法在U-Net网络结构的基础上进行改进,提出了轻量级两分支车道
学位
学位
学位
近年来,我国汽车保有量呈总体上升趋势,这也间接造成了道路交通事故数量的不断增长,使人们的生命财产遭受了巨大的损失。自动紧急制动系统(AEB,Autonomous Emergency Braking)作为车辆主动安全技术中的重要一环,可以作为降低交通事故发生率的重要手段,因此对AEB控制策略进行研究具有重要意义。本文通过车辆动力学结合车辆状态估计方法和车辆防撞预警控制策略进行研究,完成总体自动紧急制
学位
在面向灾害应急救援工作时,因灾害所产生的损害导致通信链路受损,需要对灾区环境中的通信系统进行恢复,以便指挥中心能够及时获取灾区信息,展开救援任务。传统的灾害应急部署通信基站进行通信的成本高,还影响灾害救援效率,随着无人系统技术的日渐成熟,基于无人系统构建的异构物联网成为灾害救援的首选。在现实的灾难场景中,灾难事故往往存在着突发、决策的非程序化,以及不确定性大等特点。因此,本文首先针对应急异构物联网
学位