融合类别线索词的中文问题分类

来源 :苏州科技大学学报:自然科学版 | 被引量 : 0次 | 上传用户:soj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对中文问题中分类有效信息较少这一特点,提出一种融合类别线索词集(CCWs)的自动特征组合绑定算法。该方法在提取词袋、词性和命名实体的基础上,通过对问题意图刻画更为准确的中心词、主语、疑问词以及疑问词相关成分作为问题类别线索词集。通过实验表明,利用CCWs和基本特征进行特征组合以及绑定后形成的新特征,在小规模不平衡的语料数据集上能有效提高分类器的分类性能。该组合绑定的方法在一定程度上提高了SVM分类器的精度,分别在小类和大类上达到86.77%和94.08%。
其他文献
为了更好的度量标准文献的重要性,现将Page Rank算法引入到标准引用网络中,但算法在计算标准文献重要性时仅根据出度数来平均分配Page Rank值,在一定程度上影响了标准文献重
为了探究混凝土空洞雷达图像昕呈现的规律,基于时域有限差分法,通过GprMax3.0软件,建立了不同形状、不同填充介质的地下空洞模型。对这些空洞模型进行了正演模拟,得到了雷达图谱,分