【摘 要】
:
大规模和高质量的标注语料是进行监督算法分类器训练的重要前提,而进行大规模的语料标注是一项费时费力的工作,并且针对特定的领域还需要该领域专家的介入.提出一种基于语义
【机 构】
:
太原理工大学外国语学院,太原理工大学信息与计算机学院
【基金项目】
:
教育部人文社会科学研究规划基金(17YJA740031)
论文部分内容阅读
大规模和高质量的标注语料是进行监督算法分类器训练的重要前提,而进行大规模的语料标注是一项费时费力的工作,并且针对特定的领域还需要该领域专家的介入.提出一种基于语义模式的半监督中文观点句识别方法,可以通过小规模语料的训练识别出中文观点句.首先,通过语义模型提取算法从训练集当中识别出观点句语义模型和非观点句语义模型;然后,将两种模型转化为语义特征,并且加入词汇特征和词性特征两方面特征,通过BootStrapping对小规模标注语料进行训练,得到朴素贝叶斯分类器;接着,使用朴素贝叶斯分类器对大规模未标注的语料进
其他文献
2002年全国金融工作会议再次强调:必须把银行办成现代金融企业,把国有独资商业银行改造成治理结构完善,运行机制健全,经营目标明确,财务状况良好,具有较强国际竞争力的现代大
部队资金,是由军费转化,并为部队各级所拥有,在一定行为规范下直接保障于部队战备、训练和人员生活必需的单位财力.部队资金控制,是按照规定的程序和内容,对单位所有的一切财
车型识别分类,对低/高速行车道划分、流量统计,特别是超长/重、危险品车的识别具有现实意义.实验室曾提出的基于尺度不变特征转换SIFT、方向梯度直方图HoG视频检测方法抗干扰能力弱,在因道路环境差、网络拥塞随机造成图像模糊时,往往误判.为此,在机理上,分析比较了上述分类算法与特征白化、稀疏编码算法的局限或优势,提出了适应低清晰度视频的"白化-稀疏特征"车型分类算法.该分类算法采取PCA白化技术特征数
提出一种基于聚类的启发式选择性集成学习算法.集成学习通过组合多个弱分类器获得比单一分类器更好的学习效果,把多个弱分类器提升为一个强分类器.理论上来说弱分类器的个数越多
本文提出采用基于频谱校正技术的增强型频域光学相干层析系统(EOCT)及其在非接触结构振动和热变形检测的应用.该EOCT系统采用基于CCD的宽带光谱仪以及宽带低相干的白光,所以这个增强型光学相干层析系统具有很高的检测分辨率,可达到0.9μm精度.但是,由于光谱信号作傅里叶变换的过程中产生了能量泄露,从而导致振动或热变形检测存在一定程度的误差.为了解决这个问题,本文提出采用一种频谱校正技术来校正此误差
当调查描述的结果与事实出现差异,便产生了调查误差.调查的数据质量与调查误差成反比关系.调查误差主要包括:抽样误差(Sampling Error)和非抽样误差(Nonsampling Error).所以
洪山嘴办事处位于老河口市北部,全办辖26个村委会,1个居委会,耕地面积62243亩,人口60500人。近几年来,先后获得全国计划生育先进单位、全省优质水果示范园、全省退耕还林先进单位
企业要保证会计信息的真实准确,需要审计监督;企业要实施科学管理,使内部控制达到严密、完整和有效,同样需要审计监督和服务.内部审计已成为企业自我发展的需要,成为现代企业
人脸分割对于人脸识别、人脸三维建模等人脸图像处理问题具有重要意义,而人脸图像往往轮廓边缘模糊、梯度不明显,常规无边缘几何活动轮廓模型通常无法获得理想的分割效果且计算量较大.为实现快速、准确的人脸轮廓定位及分割,将无边缘几何活动轮廓模型和稀疏场数值算法相结合提出了一种改进的算法,并结合人脸检测和数学形态学算子提出了一种基于曲线演化的人脸分割方案.实验结果表明,该算法不仅提高了计算效率,而且可以有效地