基于相关性特征权重选择决策树算法的学术关系分类规则提取

被引量 : 0次 | 上传用户:zhurichen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人物间的关系的识别和分类是近年的研究热点。对人物间学术关系的研究能为我国日益庞大的学术关系网络的建立做好铺垫,而识别人物间学术关系的类别则是研究人物学术关系的重点。论文旨在从海量的项目申请书中提取学术关系分类的规则,并提出了一种利用基于相关性特征选择方法的特征权重决策树算法。本文将人物间的学术关系定义为师生关系、合著关系、共项目关系三种,根据项目申请书的特点结构化项目申请书,通过特征抽取函数设计,对每一类学术关系采集相应的训练集原始数据,使这些原始数据通过特征抽取函数得到面向决策树的训练集数据,然后对训练集数据采用C4.5算法得到判定每一类学术关系的决策树,并提炼分类规则。最后,为了提高分类规则的准确率,本文提出了将相关性特征选择与C4.5算法结合,在生成决策树之前选择出关键的特征变量,在生成决策树时给这些关键特征变量赋予一个大于给定阈值的权重,使其更容易被选择。实验结果表明,当传统C4.5算法得到的决策树没有包含所有的关键特征变量时,改进的C4.5算法生成的决策树的可理解度和精度都有所提高,同时,由改进C4.5算法得到的分类规则的精确率和召回率的综合值也能得到提高。
其他文献
随着医学模式的转变和新医改方案的出台,对基层卫生服务提出了新的要求,要求大批合格的全科医生,因此,全科医生的师资培训就显得至关重要.我们需要结合全科医学系统性、有机
本文对国内外采用MEMS技术检测爆炸物的方法进行了分类,主要将其分为测温法、位移法、压阻法、谐振法等,分别介绍了它们的检测原理,分析了在灵敏度、选择性、抗环境干扰能力
<正>颈椎病是临床上的常见病,是因为颈椎的退行性改变致使神经、血管、脊髓等受到刺激而产生的一系列的临床症候群。颈型颈椎病主要是以传统的牵引、按摩、针灸、理疗、中药
薄壁零件制造过程中的变形控制研究是现代制造领域的重要课题。介绍了薄壁零件的结构特点,分析了加工变形的影响因素,表明材料与结构、装夹工艺、切削力与切削热、以及残余应
为了在空间激光通信中实现高速实时的光轴检测,采用FPGA(可编程逻辑门阵列)实现对CCD传感器的实时驱动与处理是十分有必要的。从工程角度出发,研究采用FPGA完成CCD传感器的驱
在市场经济条件下,建立大学生就业的社会保障体系是促进大学生就业的基础性工程。当前,我国大学生就业社会保障体系还不健全,存在覆盖范围狭窄、制度不完善、保障体系发展不
三维扫描激光雷达的优点在于能够快速准确地获取环境的三维几何信息,但同时它高昂的价格也大大限制了它的应用范围.设计了一个快速三维扫描激光雷达系统,并为其内在参数做了
本文研究了内标校正-电感耦合等离子体质谱法测定高纯钼粉及钼酸铵、氧化钼中痕量杂质的检测方法,以及辉光放电质谱法测定高纯钛、钼中痕量杂质的分析方法。使用辉光质谱法实
鲁克沁稠油油田为亿吨级深层稠油油藏,油藏埋深2100~3600m之间,储层物性较差,孔隙度13%-30%,渗透率一般50~700×10-μm2,随着埋深变化,具有东好西差的特点。中、西区稠油具有高
由于电子废弃物数量大,危害性大且经济价值高,实现电子废弃物的资源回收已成为一项全球性的课题。其中,贵金属的回收是电子废弃物回收的主要经济动力。针对电子废弃物中贵金