论文部分内容阅读
中药是中医临床处方的基本构成单元,是中医医生为患者提供诊疗方案的关键。中药的主治临床表征(以症状体征为主要内涵),即患者的个性化症状是临床处方用药的重要依据和标靶,是支持中医临床个性化治疗的重要知识。医生在处方的基础上进行随症加减的主要依据是常识或经验性的药症关系。但由于中药的功效与化学成分的复杂性,药症关系的发现和研究仍是一个复杂问题。因此,在现阶段领域数据积累和分析方法进展的基础上,研制合适的药症关系分析方法,对个性化的临床诊疗和中成药新药研发等都具有重要价值。本文基于《中国药典》和《中华本草》两部经典的中药文献数据,开展基于协同过滤、矩阵分解和网络表征学习等方法的药症关系分析研究。主要工作包括如下两方面:(1)本文进行了基于相似度计算的药症关系知识发现研究。首先本文基于《中国药典》与《中华本草》,通过人工加工构建标准数据集,其中包括48000个中药-症状关系数据,为相关方法的研究提供了数据基础。在此基础上本文研究了两类基于相似度计算的药症关系预测方法:协同过滤和网络嵌入表示学习。两类方法充分考虑中药的性味、功效等属性信息。研究发现,在协同过滤方法中,进行特征融合的模型性能更为显著(Coverage从44%提升到47%);在网络嵌入表示学习方法中,基于DeepWalk的方法性能更好。总体而言,在药症关系知识发现方法中,采用特征融合的协同过滤方法性能最好。(2)本文进行了基于矩阵分解的药症关系分析研究。首先,本文提出基于非负矩阵分解(NMF)和奇异值分解(SVD)的药症关系分析方法,研究表明,相比NMF方法,SVD的总体性能较好。鉴于现有药症关系的稀疏性,本文利用中药间的功能相似性,进行了药症关系矩阵的补全处理。研究发现,矩阵补全后的矩阵分解方法性能获得一定提升(RMSE从0.8709降低到0.7122),另外,为充分利用中药的功能属性,本文提出基于元路径(Meta-path)的网络嵌入的SVD算法进行药症关系分析研究。该方法性能最佳(RMSE从0.7122降低到0.3062)。以上研究结果提示了中药的关联性功能属性对药症关系的分析研究起到重要作用。