【摘 要】
:
当今社会,随着经济不断发展,汽车成为家庭主流的代步工具。回看近十年各大汽车品牌在国内的销售排行发现,一批国内本土新品牌如春笋般拔地而起,其主要原因就是近些年传统汽车行业的衰退,以及新能源电动技术的发展,伴随着的人工智能,物联网(车联网)的兴起,大批软件公司和互联网巨头都纷纷选择投入到新型汽车产业中。这样的状况与趋势势必对产业链上的零部件研发企业带来了巨大的挑战。对于汽车零部件研发企业来说,其核心竞
论文部分内容阅读
当今社会,随着经济不断发展,汽车成为家庭主流的代步工具。回看近十年各大汽车品牌在国内的销售排行发现,一批国内本土新品牌如春笋般拔地而起,其主要原因就是近些年传统汽车行业的衰退,以及新能源电动技术的发展,伴随着的人工智能,物联网(车联网)的兴起,大批软件公司和互联网巨头都纷纷选择投入到新型汽车产业中。这样的状况与趋势势必对产业链上的零部件研发企业带来了巨大的挑战。对于汽车零部件研发企业来说,其核心竞争力就是针对上游主机厂客户的不同需求,提供高效优质的设计产品。如果要设计出符合要求的零部件,其相应的研发企业必须仔细分析客户需求清单,将其对应的准确信息传达给企业内部相应部门。产品需求清单一般由汽车主机厂编写,其会根据具体的产品组件形成相应的整体报告,并在确定下游零部件研发供应商后,交付供应商进行需求确认。此时零部件供应商内部的产品研发流程开始项目初期阶段。各子零部件部门需要针对主机厂的产品开发需求,仔细分析与本部门相关的要求,如品质及周期要求,在此基础上评估设计能力、风险、完成时间和效益等,同时也要评估和其他子零件部门的协同设计要求。因此各子零件部门针对同一份客户需求清单,需要不同的技术人员花费重复时间对内容进行阅读和摘取,而且负责的技术人员必须具备丰富的产品知识,无法短期内进行培训上岗。因此目前在很多企业内部,对如何采用自然语言处理技术代替人工,实现需求文本信息分类引起了很多关注和研究。本文就如何通过语言模型如何实现汽车零部件领域目标文本分类做出了针对性的研究。通过研究发现汽车领域文本存在很多专业词汇,这些词汇其中有很多在百度,维基百科等通用语料中很少出现,有一些甚至是专业词组的缩写,并没有在通用语料中出现过。在对具体客户需求文本进行句子分类任务时,通用预训练模型的特征向量并不能很好的表示专业领域的文本内容及含义。1.本文基于通用BERT模型,加入汽车零部件领域目标任务语料进行二次预训练,扩充词典库加入相关专业词汇,并训练得出相关词向量以用于下游分类模型的初始化参数。通用基础模型采用huggingface公开的基于Pytorch BERT(BERT-Base-Uncased;隐藏层数量Hidden Layers:12;词向量维度Hidden Size:768;注意力头数Attention Heads:12)英文语言模型。原始词典尺寸为30522,扩充专业词汇后尺寸为40364。二次预训练参数量总计109514298。文本行数达到11861行。2.二次预训练完成后使用保存的结果模型和参数对下游2个目标任务(“Object Type”,和“Review Assignment”)进行句子分类,基于同样的微调设置,对比使用通用预训练模型和二次预训练后的模型预测结果,发现使用通用预训练BERT模型预测准确率(“Object Type”,和“Review Assignment”)分别达到98.85%和87.13%,使用二次预训练后的模型预测准确率达到99.14%和87.81%。两个分类任务经过二次预训练后模型预测准确率分别到达0.29%和0.74%的提升。3.同时在此结果的基础上,微调过程中的参数优化函数分别采用Adam,Adam W和Adam+Amsgrad,Adam W+Amsgrad分别对模型参数进行优化对比,结果证明采用Adam W+Amsgrad优化器更有效,相对其他两个优化器,于此结果有小幅提升。同时使用不同的模型微调参数,包括回合(epoch)数量、批量大小(batch size)和学习率(learning rate)的不同参数设定对基于Adam W+Amsgrad优化器的二次预训练模型性能进行分别验证,最终经过模型参数优化后的两个文本分类任务在基于BERT二次预训练模型的基础上,准确率分别由99.14%提高到99.32%(分类任务一“Object Type”),和87.81%提高到88.35%(分类任务二“Review Assignment”),两个任务各自提高了0.18%和0.54%。本文通过在通用BERT预训练模型上加入汽车零部件专业领域内文本语料进行二次预训练的模型,以及未进行二次预训练的BERT模型,同时结合早前使用的传统朴素贝叶斯(Na?ve Bayes)模型和支持向量机(SVM)模型同时对两个领域内目标分类任务进行训练预测(其中朴素贝叶斯模型和支持向量机模型分析过程在此文中并未展开讲解),证实BERT模型在汽车零部件领域文本任务上表现优异,并且在此基础上加入专业领域语料后二次预训练的模型性能也有明显提升,证实了此方法的可行性,后续可加大二次预训练的文本范围,以获得更好的模型性能。并且本文最终调优后的模型能够直接用于后续领域内相关文本分类任务,为企业带来了实际的应用价值。
其他文献
随着我国5G网络建设的全面铺开,智能手机已被广泛使用,我们的工作生活已然离不开它。互联网的全速发展开始渐渐改变了传统商业银行的业务模式,电子银行业务应运而生,而作为电子银行的一部分,手机银行也得到了越来越多的关注和大力推广。从目前来看,手机银行业务是商业银行数字化转型之路的重要一步,它对银行的重要作用不言而喻。伴随着客户量的日益增加和交易规模的增长,客户的需求越来越多样化,做好做强手机银行将对商业
互联网的持续发展为网络购物和线上消费持续提供增长驱动,网络购物产业持续保持高位发展,加之新冠疫情的影响,线上消费成为很多消费者主动或被动的选在的主要消费方式,随之而来的,是在线评论数据的持续爆炸式增长。在网络信息超载的大环境下,评论信息作为最易获取的商品信息源,是买卖双方的第一道沟通桥梁,为消费者提供购买决策的参考建议,并且直接影响到品牌形象及口碑、用户忠诚度和产品营销效果。因此,如何衡量在线评论
21世纪以来,全球经济、贸易一体化进程不断增强,中外体育交流愈发频繁,中国承办了许多国际大型体育赛事,如2008年北京奥运会、2010年广州亚运会、2022年北京冬奥会等。语言是人类沟通的桥梁,目前大型体育赛事语言服务也在加速发展、优化。优质的语言服务,畅通的沟通交流渠道是大型体育赛事成功举办的必要桥梁,也是衡量举办国举办水平高低的重要标准之一。因此,大型体育赛事语言服务对翻译者乃至翻译软件设备等
目前,银行业的信贷风控问题较为严峻,银行内的不良资产,不仅会对银行金融机构本身造成影响,严重的还可能在金融机构间造成违约风险的传染进而影响社会经济的发展。当前,对于公司信贷业务的风险把控主要还是依靠人为主观判断,手段和方法比较单一。机器学习的发展给银行业信贷业务风控管理带来了新的理念和机遇。借助机器学习算法,学习公司信贷客户多维度的全面信息,预测贷款违约的可能性,尽早采取对应措施、调整授信策略,将
近年来股票市场的发展越来越受到大众的关注,科创板上市,创业板涨跌幅改革等,为市场注入了新的活力,新增投资者数较以往也有大幅度的提升,现有投资者已近1.9亿(数据来源:上海清算网,截至2021年8月数据),80、90甚至00后加速进入市场,信息获取及互动交流的渠道与方式也已有很大不同,更侧重个人情绪表达,反馈方式也更加直观高效。券商针对当前形式衍生出的新型需求,同时也在积极进行服务方式探索,如直播、
<正>带电粒子在速度选择器中的速度大于或小于E/B时,其运动轨迹是圆摆线,一般的处理方法是将运动轨迹分解成匀速直线运动和匀速圆周运动。很多学生对此感到困惑:这样的分解真的合理吗?当粒子偏转时,电场力做功,速度发生变化,洛伦兹力的大小和方向也都发生变化,这难道不会对圆周运动轨迹的半径产生影响吗?关于这个问题,网上亦有相关证明,但都是利用微积分和常微分方程解决,超出学生的认知水平。下面,探讨如何帮助学
股票市场是反映国家经济情况的晴雨表,股价趋势也受到广大金融投资者的密切关注,因此对于股价的预测始终是非常重要且热门的主题。传统的股票分析主要是基于技术面和账面价值的分析。前者主要寻求依靠股价在时间周期上的波动来发觉价格变动规律,后者追求的是股票能带来的现实股利和账面价值。更进一步的办法是结合上述因素再构建的量化模型,通过因子筛选构建数学模型以解决预测问题。随着近年来深度学习技术的飞速发展,其自我优
<正>理解核心概念是培育核心素养的关键。准确把握学生的学习起点、过程和结果,在单元整体教学中做好种子课、生长课和衔接课的教学,有助于促进学生深度理解教学内容。在单元教学中,重视“计数单位”这一核心概念的植入,有助于实现数的意义和运算整体性理解的学习进阶。核心概念教学要求把主题内零散的内容联系起来,促进知识与方法的迁移,它是促进有意义的、联系紧密的知识学习的一个实用而强大的工具。教材中教学内容的编排
随着投资意识的提高和基金行业的发展,基金为大众所熟知,但人们面对如此繁多的基金很难做出选择,况且大部分人对如何投资基金并没有规划,不能有效分散风险。而FOF因其专业性强、双重分散风险的特点,正能满足投资者稳定收益以及多样化资产配置的需求。FOF分散风险、稳定收益主要是通过大类资产配置、精选基金来实现,大类资产配置是FOF的投资框架,是FOF的重中之重,而如何有效预测风险是资产配置的关键问题。传统预
外国直接投资(FDI)是国际转移的重要组成部分,在全球经济中发挥着重要作用。虽然大量的外国直接投资流动发生在经济合作与发展组织(经合组织)国家之间,但对发展中国家也特别重要。外国直接投资被视为增长催化剂,因为它可以为东道国带来管理技能,专门知识,进入国外市场的机会和技术。蒙古国是一个发展中自然资源丰富的国家,其经济越来越依赖采矿业。自2011年达到峰值以来,蒙古的外国直接投资一直在下降,蒙古政府采