论文部分内容阅读
信息时代的到来使各种决策判别业务趋向自动化与智能化,在决策业务中,决策规则与机器学习算法都发挥了不可或缺的作用。决策相关的业务人员不一定具有丰富的机器学习知识,难以理解机器学习算法的决策过程,而业务中的决策规则是清晰明了的,可视化的规则列表使业务人员几乎不需要学习成本就可以看懂。由于机器学习算法中本身就蕴含着决策规则,这些规则在一定程度上体现了算法模型的决策过程,与业务中的其他规则具有一定的关系。因此,本文立足于决策业务场景,以电信反诈业务为例,将决策业务中的各种规则进行了形式化的定义,对规则的操作进行了形式化证明,将决策树、随机森林、贝叶斯分类器、神经网络四种典型机器学习算法进行了规则提取,研究并实现了基于信息增益的决策树规则提取算法、基于规则重要性的随机森林规则提取算法、基于混合属性分割的单隐层递归神经网络规则提取算法、基于概率估算的贝叶斯分类器规则提取算法四种规则提取算法,通过规则提取对模型的决策原理进行了解释。算法产出了正确的规则,并对数据进行正确判别。为了整合了决策业务中的各种规则,本文提出了基于动态检查的规则整合算法和全局规则整合算法。这些算法将决策过程规则化,极大地减少了业务人员的学习成本。决策的过程是需要与时俱进的,如在反诈业务中,为了应对日益进步的诈骗行为,识别诈骗的规则需要不断迭代。人工的迭代决策系统,无法保证效率与准确性,因此,在决策过程规则化的基础上,本文提出了基于概率模型的规则库自更新算法,在日常使用系统的过程中及时发现新的规则,极大地提高了系统的迭代效率和准确度。经验证,该算法可以快速正确地生成新的规则。进一步地,为了给上述算法一个支撑平台,本文设计并实现了典型机器学习算法规则化解释与分析平台。通过使用本平台,相关业务人员可以摆脱复杂的学习过程,通过本平台的界面快速的掌握决策状态,调控决策过程。本文首先从决策业务的现状与需求出发,阐述了整个课题的研究背景与实际意义,列举了国内外相关技术的研究现状。接着对整个系统进行了需求分析,按照用户对系统的使用情况将系统分为模型规则处理、规则库管理、规则自更新、规则执行四个功能。然后针对实现系统需要解决的关键问题,进行了研究并解决,提出了相关算法。接着从系统本身出发,对整个系统的架构与功能进行了设计与实现,对模块内部类与接口进行了详细介绍,通过重要功能的流程描述了模块之间的交互。最后对系统的部署与测试进行了说明,并对论文进行了总结与展望。