基于BI_LSTM_CRF神经网络的序列标注中文分词方法

来源 :现代电子技术 | 被引量 : 0次 | 上传用户:jfskldafkld
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前主流的中文分词方法是基于有监督的学习算法,该方法需要大量的人工标注语料,并且提取的局部特征存在稀疏等问题。针对上述问题,提出一种双向长短时记忆条件随机场(BI_LSTM_CRF)模型,可以自动学习文本特征,能对文本上下文依赖信息进行建模,同时CRF层考虑了句子字符前后的标签信息,对文本信息进行了推理。该分词模型不仅在MSRA,PKU,CTB6.0数据集上取得了很好的分词结果,而且在新闻数据、微博数据、汽车论坛数据、餐饮点评数据上进行了实验,实验结果表明,BI_LSTM_CRF模型不仅在测试集上有很好的
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
运用体验经济理论,分析环巢湖国家旅游休闲区体育旅游供给现状,认为区域内游客参与体育旅游热情高,政府积极谋发展;体育赛事形成"四季品牌",但供给缺少层次;单体有差异,缺少
随着时代的发展,手机无论是在工作或者生活或者是学习上都得到了很大的应用,尤其是智能手机。通过手机,掌握国内外最新新闻动态、记录你的旅行足迹、保存你珍贵的记忆、体会
通过对东湖国家自主创新示范区企业“四类人员”用工现状、特点及招聘情况进行调查,分析发现示范区在低端人力资源的培养、引进和开发等方面存在的一些问题,分别从政府、企业和
【目的】干旱是威胁农业生产的主要气象因素,合理利用作物抗旱种质资源是生物节水的重要内容。通过研究水分胁迫对不同抗旱性砧木嫁接番茄生长发育及水气交换参数的影响,探讨
本文讨论了老年女装在版型设计的多样化原则下,合理运用版型设计的3要素的不同功效,使老年服装版型设计达到美观性与机能性的协调统一,并根据老年人的体型特征,修正省在版型中的
自20世纪中期真正意义上的现代化集装箱运输诞生以来,这种运输方式以其在货运质量、装卸效率、周转周期、运作方式标准化等方面的巨大优势,赢得了全世界的瞩目,成为全球物流
相对于从教师或学生层面研究高职生就业竞争力,用人单位的需求评价更有可信度。通过半结构化访谈,厘清用人单位需求的高职生就业竞争力16个主要指标。采用主成分因子分析,识
我国的职业教育在发展中出现一些值得注意的问题,影响到职业教育的健康发展,为使职业教育更好地服务于社会,应有针对性地采取多种措施推进我国职业教育的健康发展。