BERT相关论文
随着近年来中国互联网经济迅猛的发展,各行各业千变万化。互联网技术和实体行业的结合也衍生出了许多新兴行业,这些创新和融合给人......
自2012年谷歌提出了知识图谱的概念至今,知识图谱这一领域一直是科学研究和科技应用的前沿热点,其应用也涉及了从搜索到推荐等众多......
我国是煤炭生产和消费大国,在很长一段时间内,煤炭都是国家的主要能源。随着煤炭电子商务时代的到来,煤炭电商让煤炭交易更加便捷,......
网络威胁情报实体识别是网络威胁情报分析的关键,针对传统词嵌入无法表征一词多义而难以有效识别网络威胁情报实体关键信息,同时面临......
针对传统命名实体识别方法不适用于中医领域,提出一种适用于中医领域的命名实体识别方法。在医古文数据集上的结果证明,所提出的模型......
中文电子病历的命名实体识别是临床医疗领域中文本信息挖掘的重要任务之一,而中文电子病历有着较为独特的文本结构以及词语分布,但通......
期刊
针对现有胸部X线影像和诊断报告跨模态方法重点聚焦全局信息对齐,忽视影像和诊断报告之间的细粒度语义关联,导致检索精度低、匹配度......
本文基于深度学习框架及自然语言处理,将政企类文本智能分类过程中的文本预处理、模型构建、分类效果比较等环节进行了实现与分析。......
【目的】针对网络“水军”发布的虚假评论信息在电商网站泛滥的问题,集成了一种面向中文电商网站评论的融合图像信息与文本语义的......
随着在线音频市场的迅速发展,国内音频用户规模急剧扩张,音频平台亟需洞悉影响用户付费决策的重要因素,以提升盈利能力。目前已有......
对敏感个人信息的分级保护不仅是对公民隐私权与个人信息权的尊重与保护,更是数字化浪潮下探寻个人信息合理利用与安全利用的关键平......
[研究目的]高效识别和挖掘海外媒体的涉华新闻舆情及其特征分布,对于我国全方位、多角度了解国际社会的对华关注点和国际舆情场变化......
针对用户的中文评论文本在抑郁倾向上的准确分类问题,提出一种基于领域情感词典与字词特征融合的中文抑郁症文本分类方法.首先基于......
开源软件发展迅猛,对于开源项目来说,开源许可证的选择已然成为最为关键性的问题,考虑项目中所用开源组件的许可证兼容问题,稍有不慎就......
青春期是心理问题的高发期,其中心理疾病和自杀问题尤为突出。现有利用计算机相关技术解决心理预警问题的方式主要有两种,一是通过......
随着铁路客票系统12306互联网售票功能的不断优化,使用该系统购票的旅客数量与日俱增,伴随而来的投诉问题也呈现多样化的特点,如何......
为提高中文电子病历中命名实体识别模型鲁棒性和准确性,为此提出一种基于BERT模型融入对抗网络的中文电子命名实体识别模型,该方法使......
近年来,在数字化时代的背景下,随着网络信息技术在社交媒体、电子商务、信息检索和推荐等领域的广泛应用,互联网上复杂文本的数量......
近年来社会出现的司法纠纷逐渐增多,导致司法案件数量快速增加,使人民法院的工作任务量逐渐增大。法官对案件的判决是将犯罪事实与......
文本分类是自然语言处理的一个重要领域,随着深度网络的发展,大规模预训练模型日渐成为文本分类任务的主流模型,但大模型的推理速度慢......
本文立足于当下政府对中国各类企业安全方面的管控情况,了解到尽管相关管控工作已取得不错的成绩,但是仍然存在部分企业企图投机取巧......
随着软件数量和种类的快速增长,有效地挖掘软件需求的文本特征,并对软件功能性需求的文本特征进行分类,成为软件工程领域的一大挑战。......
商品评论为商家的选品和用户的购买提供了重要的决策帮助。为了获得商品评论的情感特征,并在评论中捕捉更多的情感信息,本研究提出一......
基于神经网络和深度学习的预训练语言模型为自然语言处理技术带来了突破性发展。基于自注意力机制的Transformer模型是预训练语言......
随着互联网的快速发展,网络上的文本数据越来越多,更好地挖掘文本数据的价值成为人们越来越关心的需求之一。文本数据挖掘领域的情......
如今,电话诈骗案件层出不穷,严重危害到了人们的财产安全和社会的和谐安定。针对社会中的一些诈骗电话问题,提出了一种基于词嵌入和混......
[研究目的]在为互联网金融(以下简称“互金”)风控监管构建风险情报支撑体系的视域中,进行专门面向互金安全情绪感知技术的研究,提出......
机器问答是通过自然语言处理技术,使机器可以理解人们用自然语言提交的问题,同时并对问题做出响应回答。针对机器问答进行研究,采用了......
方面级情感分析是细粒度情感分析中的一项关键任务,旨在预测一个句子中不同方面术语的情感倾向。针对目前结合图卷积网络的研究忽略......
人类活动80%的信息与地理位置有关,从大体量的具有地理位置的网格事件数据中提取信息,构建典型的网格事件知识图谱,为辖区管理决策提......
随着5G技术的出现以及计算机技术突飞猛进的发展,通过互联网发布和获取信息变得越来越容易。面对人工难以处理信息爆炸式增长的困......
学位
针对方面级情感分析存在的局部信息捕捉不充分、多个意见词混淆的问题,提出了一种基于词共现的方面级情感分析模型。该模型将方面级......
随着现代信息科学技术的发展,互联网用户的爆发式增长,对海量数据的处理在数据处理领域正变得愈发重要,而人工神经网络(Artificial ......
随着互联网信息的爆发式增长,传统搜索引擎很难满足用户精确检索信息的需求。问答系统将问题进行语义化分类,能够更准确直观的返回......
目前,基于编码器-解码器框架图像描述模型在编码阶段未考虑同一个单词在不同语句中的差异,在解码阶段未考虑语言序列的层级结构。为......
[目的/意义]通过研究我国新冠肺炎疫苗研发过程中公众关注热点变化,了解对疫苗的需求,有助于政府部门有序推进疫苗的接种,有效构筑全......
为深入挖掘网络评论数据的价值,便于商家了解产品的不足,为用户提供购买建议,提高用户满意度,利用LSTM模型、贝叶斯模型和BERT模型,对评......
随着电网的自动化和高效化需求增加,电力行业需要加快打造高智能、高智慧平台的步伐。目前电力系统是人类建立的最复杂的系统和网......
针对现有舆情监测系统对于未登录词的钝化问题,构建了一个基于BERT模型(bidirectional encoder representation from transformers,......
随着人类社会进入互联网时代,人们生活的方方面面都与网络密切相关。截止至2021年6月,我国网民人数已达到10.11亿。在如今数据量庞......
传统的医学文本数据分类方法忽略了文本的上下文关系,每个词相互独立,无法表示语义信息,文本描述、分类效果差,并且特征工程需要人工干......
传统恶意网页识别缺乏全局性、系统性考量,没有将网页作为有机整体,而是独立针对标签结构、URL地址、文本内容等特定层面特征开展研......