【摘 要】
:
为了克服高考阅读理解观点类问题中仅仅利用关键词进行答案句抽取的不足,通过对单篇文章建立LDA(latent dirichlet allocation)模型,计算阅读材料中每一句话与问题的主题分布
【机 构】
:
山西大学计算机与信息技术学院,山西大学计算智能与中文信息处理教育部重点实验室
【基金项目】
:
国家“863”高技术项目(2015AA015407);国家自然科学基金项目(61573231,61632011,61672331)
论文部分内容阅读
为了克服高考阅读理解观点类问题中仅仅利用关键词进行答案句抽取的不足,通过对单篇文章建立LDA(latent dirichlet allocation)模型,计算阅读材料中每一句话与问题的主题分布相似度.利用SVM(support vector machine)分类器,对主题分布相似度高的句子进行分类,用于获取具有观点特征的候选观点句,最后将其与问题观点进行相似度计算并排序,选取排名前α个句子作为题目的答案句.该方法在标注好的高考观点类问题的答案句识别中,总体正确率达到了47.8%,并能将答案句的排序提前.实验结果表明,散文阅读理解题中采用多主题方法比单主题时具有更好的效果.
其他文献
为研究倾角和复合靶板各层厚度变化对陶瓷橡胶复合靶板防护性能的影响,通过优化对比网格划分疏密程度,获得与实验较接近的仿真结果,在此基础上,对倾角或复合各层靶板厚度不同
本文以湖北大学104名英语专业大三的学生为研究对象,采用英语语言学习策略量表,英语学习自我效能感问卷和英语专业四级成绩为工具,调查了英语专业学生的英语水平,语言学习策
目的探讨吡格列酮联合厄贝沙坦治疗早期2型糖尿病肾病(DN)的临床疗效。方法选择确诊为早期2型DN患者120例,随机分为对照组和观察组,对照组58例采用厄贝沙坦治疗,观察组62例采用
水稻作为我国的主栽作物,它的种植面积变化、长势优劣以及产量丰缺历来备受各级政府和社会大众的高度重视,也是国家和区域制定粮食政策和经济发展计划的重要依据。因此,水稻
<正>相关数据统计,现今中国已是全球最大的汽车市场,汽车逐渐走进寻常百姓家,成为人们出行的重要交通工具。而随着汽车的渐渐普及,学交规、考驾照已成为人们的必需,随之也推
纺织品的染整属于轻纺工业里面的批处理过程,轻纺工业在我国的制造业中占有重要的地位。在过去,纺织品的印染调度大多采用人工排产调度,工人凭借多年的经验进行染缸的排产,这
储能系统在兆瓦级离网型微电网中具有协调负荷和平抑波动的作用,选择合适的储能配置才能充分体现其价值和作用。充分考虑独立型光储柴微电网的控制策略,以及设备投资成本,建
浆料既关系到机织物生产的质量和效率,又关系到消费及后处理的环保性和生态性。经纱上浆过程中的浆料对环境造成污染的途径主要有两种:一是浆料调制和使用过程中剩浆和未经处
1997年修订的《刑法》本欲扩大正当防卫的适用范围,实务界和理论界都赞同这种趋势,然而至今为止,正当防卫的适用情况难以让人感到满意。从心理学上分析,造成这种情况的原因是
赭曲霉毒素A(ochratoxin A, OTA)是毒性仅次于黄曲霉毒素B1(AFB1)的真菌毒素,它会污染食品并通过食物链对人体造成危害。表面等离子体子共振(surface plasmon resonance, SPR