【摘 要】
:
科研人才的发现和挖掘不仅可为学者画像、研究领域热度分析、科研成果预测等诸多环节提供基础信息支撑,也是提升精准服务科研人才和推动前沿科技智能化水平的关键技术.针对传统机器学习算法对科研人才领域命名实体识别准确效率低、高度依赖语料库以及分词不准确等问题,文中面向科研人才的基础属性和科研属性,对该领域命名实体进行了类别和标注符号的定义,形成了7大类共计19小类的命名实体.通过使用BERT模型生成词向量,结合BiLSTM对上下文关系的记忆能力和CRF对标注规则的学习能力,构建了面向科研人才领域的命名实体识别BER
【机 构】
:
南京信息工程大学 管理工程学院,江苏 南京 210044;南京传媒学院 传媒技术学院,江苏 南京 211172;南京信息工程大学 管理工程学院,江苏 南京 210044;中国人民解放军31102部队,
论文部分内容阅读
科研人才的发现和挖掘不仅可为学者画像、研究领域热度分析、科研成果预测等诸多环节提供基础信息支撑,也是提升精准服务科研人才和推动前沿科技智能化水平的关键技术.针对传统机器学习算法对科研人才领域命名实体识别准确效率低、高度依赖语料库以及分词不准确等问题,文中面向科研人才的基础属性和科研属性,对该领域命名实体进行了类别和标注符号的定义,形成了7大类共计19小类的命名实体.通过使用BERT模型生成词向量,结合BiLSTM对上下文关系的记忆能力和CRF对标注规则的学习能力,构建了面向科研人才领域的命名实体识别BERT-BiLSTM-CRF模型.模型在包含6134条科研咨询语料库中进行了训练和参数微调,对网络爬取的科研人才相关数据上测试结果表明,该模型取得了较好的识别效果.
其他文献
研究了时效硬化型GH2696合金在不同热处理工艺下的微观组织演变及硬化行为.结果表明,随着固溶温度提高,GH2696合金基体的过饱和度增加.经1 100℃2 h固溶的GH2696合金γ\'相在780℃16 h时效处理时析出,导致硬度显著提高.650℃16 h低温时效处理起到补充时效硬化的作用,其HBW硬度值为350.
基于数据挖掘技术的推荐系统在互联网和大数据时代无处不在,它能够根据用户的兴趣和行为特征,为其推荐感兴趣的项目,具有深远的商业价值.协同过滤技术综合考虑用户的历史特征和用户之间的相似关系,为用户进行预测推荐,已经广泛应用于现有的推荐系统中.文中阐述了协同过滤技术的概念内容、前提假设、数据采集与过滤模式、数据结构、评价标准和算法分类,并着重分析对比了基于存储、基于模型和关联规则等三种推荐系统算法的不同实现方式及其优缺点.在此基础上,编程实现了向量相似性算法、个性诊断算法、奇异值分解算法和关联算法等典型常用算法
对1.0 mm厚度的S43932不锈钢冷轧板分别进行88、101、132、188J/mm的钨极氩弧焊焊接,研究了焊接区的显微形貌和相组成.详细分析了垂直焊缝、平行焊缝和带缺口焊缝试样的拉伸性能及焊缝杯突试验结果,当热输入为101 J/mm时,焊接接头具有最佳的拉伸及成形性能匹配,之后随热输入>101 J/mm,焊接接头抗拉强度和埃里克森杯突值急剧下降.焊接接头良好的力学性能与焊接区小尺寸晶粒的形成及大量富Ti(Nb,Ti)(C,N)相的析出有关.
耐火抗震螺纹钢要求600℃≥1 h的高温屈服强度不能低于常温屈服强度的2/3.本文研究了 Cr-Mo-Nb 钢的耐火抗震螺纹钢的20℃和600℃力学性能.结果表明,开发的0.21%C,0.40%Si,1.25%Mn,0.32%Cr,0.40%Mo,0.015%Nb钢,在20℃室温时,屈服强度在400~520 MPa,强屈比大于1.25,在600℃高温时,屈服强度为316 MPa,高温屈服强度与室温屈服强度的比值达到0.71,并且高温屈服强度比标准要求2/3值高18 MPa,满足耐火抗震螺纹钢要求.
利用光学显微镜、扫描电镜、布氏硬度仪等研究了 GH2036合金Φ150 mm棒材在1120-1 240℃固溶处理的组织演化和硬度变化规律.研究表明,GH2036合金锻后空冷锻材组织中主要存在富Cr和Nb-V两种类型的碳化物,在1 220℃固溶处理后碳化物大部分回溶,晶粒尺寸基本均匀.合金HB硬度值随热处理温度的升高而降低,但在1 160~1 200℃处理时,硬度随温度的升高,HB硬度值由185升至193,这主要与碳化物大幅度向基体回溶有关.
C70S6BY非调质热轧圆钢经过80t顶底复吹转炉-LF+VD精炼-240 mm×240 mm方坯连铸-Φ60 mm圆钢连轧-缓冷-精整、探伤工艺生产.采用碱度4~8 Al2O3-CaO-SiO2渣系,LF精炼45~60 min;LF离站[S]≤0.010%,[O]≤0.001%;VD后硫合金化,[S]控制在0.063%~0.065%.VD出钢前喂入含镁包芯线100~150 m,Mg收得率在11%~17%,镁硫含量比值约为1.56%.中间包钢水过热度15~30℃,铸坯拉速0.9 mn/min.经正火后,试
蚁群算法作为一种启发式算法,最初是用来解决TSP(traveling salesman problem)问题,基本思想来源于自然界蚂蚁觅食的最短路径原理,目前在快递配送中已被广泛使用.但其前期信息素匮乏导致搜索速度较慢和计算最优路径时迭代次数过多的问题尚未较好地解决.针对这一问题,提出了一种改进蚁群算法.首先,通过借鉴遗传算法启发函数的思想,对蚁群算法信息素初始值引入改进启发函数进行动态更新,针对不同情况进行寻优节点选择,解决前期搜索速度较慢的问题.其次,对信息素更新公式进行改进,引入自适应计算公式,根据
试验研究了 Φ52mm45MnVTi钢终轧917~922℃水冷返红680~830℃的组织和力学性能.结果表明,随着返红温度的降低,钢材的屈服强度及抗拉强度不同程度的升高,韧性先升高再降低,组织类型为铁素体和珠光体.当返红温度750~770℃时,钢材组织为均匀细小的铁素体和珠光体组织,且试验钢的珠光体片间距平均2.39 μm;钢材的抗拉强度平均841 MPa,屈服强度平均547.5 MPa,平均冲击功50.5 J,强韧性匹配最佳,满足使用要求.
抑郁症已经成为世界第四大疾病,并且具有高发病率,由于精神问题的诊断十分困难,抑郁症的治疗率很低.随着互联网的发展,社交媒体被越来越多的人使用,人们倾向于在社交媒体上表达自己的观点,这就为研究者创造了大量可以使用的数据,但是抑郁症预测不等同于文本分类,存在难以找到判定抑郁的统一标准,以及难以构建神经网络模型两个问题.对此,提出了一种融合局部和整体特征的胶囊网络模型,该模型将情绪词典和胶囊网络进行融合,可以有效地发现微博用户中潜在的抑郁症患者.模型分为局部特征选择和整体特征提取两部分,对于局部特征通过情绪词典
汽车发动机连杆用钢C70S6BY的工艺流程为130 t转炉-LF-RH-CCM-加热-轧制.LF精炼通过低碱度1.5~2.0的CaO-SiO2-Al2O3-MgO渣系,RH采用氮气驱动,退泵后循环5~1O min,可以精准控制钢中S、N含量(0.064%~0.068%S和136×10-6~142×10-6N).轧制后入坑缓冷,钢材组织由珠光体和少量铁素体组成,钢中非金属夹杂物主要是硫化锰和复合夹杂物.1 050℃30 min空冷钢的抗拉强度达到995~1 018 MPa,屈服强度586~611 MPa,伸