基于词向量的中文词汇蕴涵关系识别

来源 :计算机工程 | 被引量 : 23次 | 上传用户:jchenghai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
英文词汇蕴涵关系识别已有较多研究,并提出许多识别模型,但针对中文的词汇蕴涵关系获取则鲜有研究。为此,提出一种中文词汇蕴涵关系识别方法。利用词向量技术,在中文维基百科语料上进行训练,将词汇表示为词向量,设计各种基于词向量的分类特征,训练得到可用于名词词汇蕴涵关系分类的支持向量机分类模型。实验结果表明,与传统的余弦相似度方法相比,该方法以及设计的各种分类特征在词汇蕴涵关系识别方面具有明显优势。
其他文献
美国企业储蓄率在1991-2016年间稳中有升,其直接原因是与美国企业未分配利润的持续增加有关,深层次原因则是近年来美国企业利润的不断上升;进一步分析发现,美国企业利润的上
新课标对中学生的阅读朗读部分提出这样的要求“能用普通话正确、流利、有感情地朗读课文”,在实施的过程中我们发现传统的教学方法对学生兴趣的激发作用甚微,为此,我们需要在朗
从茶鲜叶中提取糖苷类物质,用茶叶粗酶水解后气相色谱分析挥发性酶解产物。结果表明:顺-3-己烯醇、芳樟醇氧化物、芳樟醇、水杨酸甲酯、香叶醇、苯甲醇和苯乙醇是水解后挥发性
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
对野生动物资源的开发合理而适度,在其保护与可持续开发间寻找契合的平衡点,实现最优管理,不仅是当前保护管理的重要问题,也涉及到多个产业部门的生存发展。本研究通过对资源
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的 采用双多普勒同步取样技术(双PW技术)测量阵发性心房颤动(房颤)患者发作期与间歇期舒张早期二尖瓣口血流峰值速度/瓣环峰值速度(E/e'),探讨双PW技术评价房颤患者不同病程中左心
目的探究长链非编码RNA母系表达基因3(MEG3)对鼻咽癌细胞增殖和侵袭的影响。方法体外培养鼻咽癌细胞系5-8F、CNE-2,转染MEG3分为空白对照组(转染试剂转染)、阴性转染组(MEG3
为充分利用多核计算资源提高图像匹配识别的实时性,设计一种基于改进最小距离法的图像匹配并行化算法。选取标准化欧氏距离来代替简单欧氏距离作为特征的相似性度量,同时在多核计算机上采用MPI+OpenMP混合编程模型对该算法进行仿真验证。结果表明,与基于最小距离法的图像匹配算法相比,该算法可以减少匹配误差和匹配运算时间,并且MPI+OpenMP混合编程模型具有较好的加速比和并行计算效率。
随着科技快速发展,互联网金融在这一时代背景下也逐渐兴起,作为新兴的银行发展模式,互联网金融不仅改变了人们传统的消费方式,也要求商业银行及时改变现有的经营模式。在互联