【摘 要】
:
随着国内人们生活品质的提高,更多的人开始关注各类保险来为自己的财物、健康等获取进一步的保障。并且伴随互联网的快速发展以及人工智能的兴起,保险行业的产品设计、风险预估等也开始逐步向智能化迈进。由于保险与人类活动密切相关,以及现代生活中人类活动的多样性,使得保险行业的各种数据和文档越来越复杂。知识图谱(Knowledge Graph)作为一种将不同数据和知识关联在一起的技术,因为它能够更加符合真实的现
论文部分内容阅读
随着国内人们生活品质的提高,更多的人开始关注各类保险来为自己的财物、健康等获取进一步的保障。并且伴随互联网的快速发展以及人工智能的兴起,保险行业的产品设计、风险预估等也开始逐步向智能化迈进。由于保险与人类活动密切相关,以及现代生活中人类活动的多样性,使得保险行业的各种数据和文档越来越复杂。知识图谱(Knowledge Graph)作为一种将不同数据和知识关联在一起的技术,因为它能够更加符合真实的现实世界,可以拓宽传统的数据存储的维度和业务展现方式,因此由搜索领域慢慢的成为了各行各业中争相研究的技术之一。通过构建保险领域的知识图谱,能够帮助保险企业综合分析客户信息,通过更有效的风险评估实现产品和投资的进一步优化;也可以为客户提供更加个性化与定制化的保险产品,构建出更加合理的保险组合等。从而实现企业和客户的双赢。本文围绕知识图谱构建的一些关键基础,针对保险领域进行知识图谱的构建工作,建立能够溯源的知识体系。重点围绕基于深度学习的命名实体识别模型从自然文本中获取保险行业相关实体,建立保险实体与自然文本的联系,实现知识溯源等功能。本课题主要工作包括如下几个方面:(1)数据的采集与预处理,这部分通过实现爬虫的前端控制系统,结合Scrapy框架的分布式能力,实现多爬虫的控制功能。并且实现了多个新闻网站和保险行业相网站等互联网网站的网站爬虫,采集了数十万的互联网网页。并对个网站网页结构做了进一步分析,实现了网页正文和关键字段的提取。最后对网页的正文文本做了主题聚类和词频等分析,实现了保险主题文本的分类与提取,为进一步的实体抽取等相关工作做基础。(2)实现基于主动学习和BERT模型的命名实体识别模型,这部分首先对BERT模型进行了初步探索,理解了BERT模型的结构和优势并针对中文对BERT模型的预训练提出改进,最后利用BERT模型构建命名实体识别模型。然后对主动学习的查询策略进行理解和分析,针对互联网数据量大的特点,提出了一种批量式的主动学习训练策略并通过实验证明了此方法的有效性。(3)实现知识图谱的构建与展示系统,针对现有知识图谱的构建方法并结合保险行业的特点做出改进,通过简化构建步骤,实现保险行业知识图谱的快算迭代更新,使其符合互联网时代数据的特点。然后对Janu Graph图数据库的特点进行理解,实现保险行业知识图谱的存储与知识溯源功能。最后实现保险行业知识图谱的动态展示与在线编辑等功能。
其他文献
随着地球上化石能源等不可再生能源的不断消耗以及各地区组织对大力发展环保事业的呼吁与支持,因此,如何高效利用太阳能这种用之不竭的清洁可再生能源成了当今世界的一大难题。钙钛矿太阳能电池因其发展迅速吸引了众多目光,其中,空穴传输材料对器件效率的提升和性能稳定性方面都有着至关重要的影响。本文设计并合成了三个以呋喃或噻吩衍生物基团作为中间单元结构的双(二芳胺基芴)类空穴传输材料,它们分别为FZH1、FZH2
激光诱导等离子体在高压驱动、微推进、激光等离子体点火等研究领域有着广泛的用途。该技术的相关研究已取得显著进步,但是仍然存在着很多问题,其中较为突出的是激光与材料的能量耦合效率低。“黑硅”是指在可见光和近红外波段具有超高的光吸收系数的硅材料。基于该特性,本文选择黑硅(black silicon)作为研究对象,研究了不同硅片的激光减反射性能,继而表征了不同硅片表面的激光诱导等离子体特性,并且从微观角度
大气颗粒物中直径≤2.5μm的细颗粒(PM2.5),能够引起肺部疾病、心血管疾病、新陈代谢疾病等。除了PM2.5本身外,PM2.5中污染物对人类健康的影响也不容忽视。PM2.5中多环芳烃(PAHs)及其衍生物,如硝化多环芳烃(NPAHs)和含氧多环芳烃(OPAHs),因对人体健康的巨大威胁而一直被关注。OPAHs的毒性很强,已有一些研究充分证明OPAHs比母体PAHs具有更强的内分泌干扰效应、致突
细菌感染一直以来都是阻碍伤口愈合的最大障碍,细菌的滋生会使伤口发炎,加重伤势,随着细菌不断发展形成的细菌生物膜还可以通过胞外聚合物进一步加速细菌的繁殖,造成伤口溃烂,化脓等危重情况。碳点(CDs)是一种新型碳纳米材料,具有优异的荧光性,水稳性,结构可调控性以及生物相容性,近几年来,CDs在抗菌领域的开发被广泛报道。水凝胶由于具有多孔性,柔韧性以及吸水和持水性等优点,被广泛应用于医用外科伤口敷料。具
我国的能源结构为贫油多煤,合理利用煤炭资源,发展化工产品和精细化学品的非石油合成路线,减少对石油的依存度对优化我国能源结构具有重大意义。由合成气经过煤基草酸酯路线可以制备乙醇酸酯、草酸甲乙酯、乙二醇、乙醇等多种基础化学品。煤制草酸二乙酯在我国已经初步实现工业化,随着众多草酸二乙酯项目的投产,终会造成产能过剩问题。因此,合理利用草酸二乙酯合成其它精细化学品得到了众多研究者的关注。本文围绕草酸二乙酯进