【摘 要】
:
随着互联网渗透到各行各业,每天都有TB级别的文本信息在互联网上发布、传播。海量文本数据为机器学习提供了丰富的训练资源,促进了自然语言处理领域的蓬勃发展。属性级情感分析是一种自动从原始文本中抽取出实体在不同属性方面的情感信息的技术。属性级情感分析技术具有广泛的应用前景。例如,从产品评论自动抽取出消费者对产品不同方面的评价,从微博推文中自动梳理出大众对热点事件方方面面的观点,从论坛、博客海量文章中自动
论文部分内容阅读
随着互联网渗透到各行各业,每天都有TB级别的文本信息在互联网上发布、传播。海量文本数据为机器学习提供了丰富的训练资源,促进了自然语言处理领域的蓬勃发展。属性级情感分析是一种自动从原始文本中抽取出实体在不同属性方面的情感信息的技术。属性级情感分析技术具有广泛的应用前景。例如,从产品评论自动抽取出消费者对产品不同方面的评价,从微博推文中自动梳理出大众对热点事件方方面面的观点,从论坛、博客海量文章中自动提炼出用户对企业、组织的各个职能的满意度等。预训练模型+微调的迁移学习方法在2018年以后快速发展,并在自然语言处理领域取得了突破性的进展。OpenAIGPT,ELMo,BERT等深度模型对语义理解的程度有了极大的提高,也给情感分析任务带来了新的思路。本文研究基于BERT语言模型的属性级情感分析技术。本文的研究工作包括:(1)本文提出了一种基于LDA主题模型的属性词扩充方法。通过把属性词扩充为一组相关词的序列,既解决了属性级情感分析任务中的属性词具有上下文依赖性的难点,又解决了属性级情感分析任务中的隐式属性与其对应的情感词难以抽取的问题。(2)本文提出了一种结合属性相关词和情感倾向的注意力机制。通过将属性相关词和情感倾向整合成属性情感文本作为属性的补充信息这种方式,增加BERT语言模型对属性相关的情感信息的关注度。解决了属性级情感分析对某一属性进行情感分析时容易受到其他情感信息干扰的问题。(3)本文提出一种接近自然语言的、基于问答句型的句子对输入方式。该输入方式能够减轻BERT语言模型对输入句子对的困惑度,降低BERT语言模型对属性级情感分析任务进行微调时的训练难度。(4)本文通过对比实验验证了提出算法的有效性。比较当前最新的属性级情感分析研究成果,本文提出的算法比BERT-Condition-CNN算法的性能提高了6%,比BERT-pair-QA-M算法提升了1%。
其他文献
南昌八一起义纪念馆馆藏口述史料种类丰富,形式多样,涉及面广。该馆对于南昌起义口述史料的搜集整理和研究,经历了由浅入深的发展过程,产生了一批成果。口述史料的整理研究对南昌起义相关历史细节还原、人物考证、史实勘误、遗址复原等均具有重要作用。当然,南昌起义口述史料的搜集整理和研究仍存在不足,还有待进一步加强。
随着半导体分立器件技术的不断发展,中国已经成为世界上分立器件的制造大国。分立器件的测试需求大大增长,对测试机的需求也急剧增长。测试机性能的优劣直接关系到企业生产的器件质量和生产效率。电压输出和测试能力是表征测试机性能的重要指标,测试机具有的电压测试能力越强,精度越高,测试速度越快,其能够测试的分立器件种类就越多、效率越高,就能获得更广泛的应用,本文研究的主要内容如下:(1)在研究PN结导电特性的基
随着社会的发展,企业的财务数据越来越庞大,这给会计师事务所的审计工作带来了困难与挑战。审计系统能否高效处理庞大的财务数据成为了审计工作效率的关键所在。会计师事务所内的审计作业系统能够帮助审计人员完成一些基本的审计工作。但是由于其开发年代久远,随着企业财务数据量逐年增长,事务所人员规模不断扩张,该系统暴露出单点故障、性能瓶颈、数据孤岛、数据安全性差、资源使用不均衡、审计流程不完善等问题。本文以全流程
在医疗实践中患者就诊信息往往碎片化的分散在多家医疗机构中,各医疗机构间数据系统相互孤立,信息很难进行对齐和补全,而完整、长周期的患者诊疗数据获取对于医疗研究十分重要。传统用于数据整合的区域医疗数据共享系统,其中心式架构容易造成安全隐患,且系统复杂,构建较为困难。现有基于区块链的分布式数据共享系统,往往同步数据量过多,运行效率低,与医院系统结合度较低,存在隐私和数据泄露风险,难以很好的应用。如何在保
本文针对个性化定制茶罐自动化生产线中的茶罐产品,提出了基于机器视觉的茶罐外轮廓检测方法,设计了个性化定制茶罐外轮廓在线检测系统,以满足多品种、小批量定制茶罐外轮廓的在线检测需求,本文主要研究内容及创新工作如下:首先阐述了机器视觉检测技术的国内外研究现状,根据个性化定制茶罐外轮廓在线检测需求,提出了论文研究内容与论文架构。然后,设计了个性化定制茶罐外轮廓在线检测总体方案,包括对个性化定制茶罐的待检测
生物3D打印,作为一种新兴的组织工程手段,已经在细胞三维体外培养、器官芯片制造、药物筛选、组织再生等方面起到越来越重要的作用。通过3D打印技术实现细胞的体外三维组装,有两个目的:其一是制造更好的类器官结构,服务于更高效的药物评价及测试;第二个更为长远的目标是实现组织/器官的体外再造。为了让细胞更好的在水凝胶模型中伸展、增殖,从制造角度需要解决两个核心问题:(1)选择同时具有优异的生物兼容性和打印性
近些年移动互联网越来越普及,移动设备进行检索的需求也越来越高。分析并计算检索的性能是评测检索的一个重要指标,同时也是进一步优化用户检索体验的一个重要依据。如何分析和计算检索性能,感知用户检索满意度这个问题,在PC领域上的研究非常活跃,但是在移动领域上很少对移动设备进行针对性的探讨,显然PC和移动设备(如智能手机)之间有非常大的差异。除此之外,在移动检索的不同领域其用户的搜索行为,特别是交互行为跟移
在新一代信息技术的推动下,国内外制造企业积极探索新的生产模式和资源整合机制,尝试实现生产过程的数字化管理。工装是辅助生产制造的重要资源,其制造与管理状况影响企业产品质量与生产效率,但也是企业信息化建设中容易忽略的环节。将工业互联网技术应用到企业工装管理中,可以提高数据的共享与交互能力,支持多任务、多用户的协同工作,对提升制造企业管理水平和工作效率有重要意义。论文依托某汽车空调离合器企业的信息化项目
随着4G网络的快速普及带来了移动互联网的高速发展,导致手机应用的业务需求越来越多,产品的迭代频率也越来越高。如何在产品快速迭代的情况下有效保障业务开发从需求管理到功能按时按质按量的交付上线显得极为重要。有效的全流程管理有助于缩短基于敏捷开发模式的交互周期,提高研发效能和研发质量。本文主要结合国内某互联网公司内部部分项目组对研发流程管理方式进行分析和设计,打造一个公司内各团队适用的全流程研发管理平台
在早期的企业信息化建设中,PC是企业日常办公的首选工具。随着云计算的快速发展,云办公类产品逐渐走进企业。尤其是在今年年初,一场突如其来的新冠疫情席卷全球各个国家,云办公类产品加速成为企业实现在线居家办公的首选方式。目前,主流的云办公类产品主要包括云电脑、云盘、远程连接工具、各类SaaS应用等,然而这些产品都或多或少地存在着问题:(1)云电脑虽然可以替代传统PC,但它仍然是一台虚拟PC。对于普通办公