一种改进的GloVe词向量表示学习方法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:sdwfzhd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
GloVe模型是一种广泛使用的词向量表示学习的模型。许多研究发现,学习得到的词向量维数越大,性能越好;但维数越大,模型学习耗时越长。事实上,GloVe模型中,耗时主要表现在两方面,一是统计词对共现矩阵,二是训练学习词向量表示。该文在利用GloVe模型统计语料中词对共现时,基于对称或非对称窗口得到两个共现矩阵,然后分别学习得到较低维度的词向量表示,再拼接得到较高维度的词向量表示。从计算的复杂度来看,该文方法并不会产生多的计算量,但显然统计共现矩阵和训练学习可通过并行方式实现,能够显著提高计算效率。在使用大规
其他文献
当前影响世界经济复苏的因素有很多,最主要的有六个方面。第一,欧洲部分国家的主权债务危机问题。虽然欧盟联合国际货币基金组织建立了7500亿欧元 At present, there are ma
通过调节粮糟比、增加排酸时间、改变量水加入方式、提高曲药粉碎度,使入窖水分降低了约5 个百分点,控制在52%-54% 范围,并对发酵生产的原酒的理化指标、感官特征和色谱数据进行
近年来,基于数据驱动的命名实体识别方法在新闻、生物医疗等领域上取得了很大的成功,然而许多领域缺少标签,且人工标注成本高昂。为了降低标注成本,该文尝试使用含有噪声的部
随着中国现代科技技术水平的不断提高,机械化、自动化、智能化的现代化养猪设备在大型猪场迅速得到推广研究应用。存在的主要问题包括近年来生猪市场价格方面有所提高等,大部分
电子病历中的临床术语描述形式具有多样性和不规范性,阻碍了医疗数据的分析和利用,因此对临床术语标准化的研究具有重要的现实意义。当前国内医疗机构临床术语标准化主要由人
地理综合题一直是学生的一大难点,失分率之高让老师、考生自己瞠目结舌。其中的原因主要有:审题不仔细、读图能力差、概念掌握不准确、知识应用欠灵活、语言表达能力不强、思
化学物与蛋白质之间的相互作用关系抽取对精准医学和药物发现等方面的研究有着重要作用。该文提出了一种基于最短依存路径和注意力机制的双向LSTM模型,并将其应用于化学物蛋
随着人们收入的增长和安全意识的加强,我国目前对生鲜农产品品质要求进一步提升,生鲜农产品供应链管理是提高流通效率保证品质的重要抓手,因此研究生鲜农产品管理尤为重要。通过
属性对齐的目标是发现异构知识图谱中表示同一概念的属性之间的对应关系,是实现跨图谱知识融合的关键技术之一。现有模型通常利用基于规则和词嵌入的方法进行属性对齐,但这些
义原(sememe)被定义为人类语言中不可再分的最小语义单位。一个词语的意义可以由多个义原的组合来表示。以往人们已经人工为词语标注义原并构建了知网(HowNet)这一语言知识库