【摘 要】
:
针对统计方法的中文分词模型主要依赖于特征工程,难以捕捉句子中长距离依赖关系等问题,提出一种双向循环网络中文分词模型.为能有效获取待分类字符的上下文特征,避免局部窗口
【基金项目】
:
国家自然科学基金项目(61202100)资助
论文部分内容阅读
针对统计方法的中文分词模型主要依赖于特征工程,难以捕捉句子中长距离依赖关系等问题,提出一种双向循环网络中文分词模型.为能有效获取待分类字符的上下文特征,避免局部窗口大小的限制,使用长短时记忆网络(Long Short-Term M emory Neural Netw ork,LSTM)作为神经网络隐藏层,同时增加一层反向LSTM抽取字符的将来信息特征.提出一种语言模型预训练的网络权值初始化方法,该模型同时得到中文字符embeddings分布式向量特征.在标准分词数据集上测试表明该模型取得比以往统计标注方法更好的效果.通过对比实验结果发现深层神经网络能提取出不逊于人工总结的分词特征.
其他文献
目的:观察自拟中药方灌肠治疗放射性肠炎的疗效。方法:将90例放射性肠炎患者随机分为治疗组与对照组各45例。两组均进行基础治疗,治疗组采用中药方灌肠治疗,对照组采用常规西
2003年以来,受电解铝行业扩张的影响,我国氧化铝一直供不应求,氧化铝价格持续在高位徘徊,引发了国内的氧化铝投资热潮。随着新建、扩建氧化铝项目陆续建成投产,氧化铝产能迅
目的:了解我省吸毒人员滥用合成毒品的情况及变化趋势,为禁毒工作提供方向性参考。方法:调查对象为獉獉獉獉2010-2014年度药物滥用监测机构收治/收戒的药物滥用者,回顾性地收
本文首次提出全新的管理概念——管要讲理(Managing According to Reason,简称MR)。管是指领导、计划、组织和控制,理是指被管客观事物的发展规律。管理新概念是管和理两大要
实验以虹鳟鱼为研究对象,进行为期56 d鱼体对不同饲料的摄食及生长实验并对两个实验组池水的水质进行监测,同时比较研究不同饲料对虹鳟鱼的摄食、生长以及饲料利用的影响。实
产业结构调整是一项长期的复杂的战略性系统工程,金融资源的配置要从全局性与前瞻性的角度出发,充分发挥助推器、加速器和导向器的作用,促进生产要素向符合产业政策要求的行
自从1998年以来,我国在房地产行业方面得到了快速的发展,房地产行业进入了非常繁荣的时期。由于在房地产行业中技术门槛比较低并且利润比较高,从而导致了很多的企业及个人投
现代家电在进行服务调研过程中,从一些厂家、服务商以及代理商处得到大量有价值的市场信息,服务的课题越研究越有价值,但同时随着调研和研究的深入,服务也有着更多可以提升和完善
建设公共文化服务体系是贯彻和落实科学发展观、深化文化体制改革、推动社会主义文化大发展大繁荣的重要途径之一,而公共文化财政投入是地方公共文化服务体系的物资保障。选
旅游城镇化是我国欠发达地区城镇化发展的重要推动力。从具有代表性的丽江市旅游城镇化发展现状出发,探讨旅游城镇化发展支撑体系的构建。丽江市旅游城镇化发展可通过进一步