基于人脸识别的来访学者信息知识图谱构建

来源 :科学与财富 | 被引量 : 0次 | 上传用户:ndhlps
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要: 为利用人脸识别快速了解学术会议参会人员、来访学者的信息,以及他们与本校学者的联系,构建相关领域知识图谱尤为重要,本文首先介绍系统构建的流程、功能模块,其次介绍了知识图谱的技术路线,最后对该系统提出改进和展望。
  关键词: 知识图谱;图数据库;人脸识别;学者信息
  1.背景介绍
  随着学校办学水平的提升,越来越多的专家学者莅临我校进行学术交流,为每位来访学者建立数据库,记录其交流的内容和与本校老师合著的信息,对未来进一步的科研教学合作有着至关重要的意义。传统的基于关键词的搜索由于其固有的重名低效等缺点将不适用于复杂的来访学者信息搜索系统,所以构建一套新的搜索系统是很有必要的,基于此本文提出了一种基于人脸识别的来访学者信息知识图谱构建方法。
  2.系统构建流程
  本系统利用图数据库对学者信息进行存储,使用人脸识别技术代替人名关键词进行检索,系统在安卓平台的智能手机上运行。用户通过客户端拍照,将目标照片导入人脸库系统,然后目标照片在系统中完成识别和检索等操作,将目标照片所对应的ID发送请求到服务器端,服务器端收到请求后,连接图数据库,返回实体属性关系等信息。
  3.知识图谱
  3.1 信息抽取
  3.1.1信息来源
  现有的知识图谱主要从自顶向下和自底向上的两种构建方式:
  3.1.2 信息抽取
  数据获取后,还需要从这些数据中抽取出实体、属性、关系等结构化信息建立图数据库。
  1)实体抽取
  早期是人工编写抽取规则,辅助利用机器学习方法进行实体抽取,但这种方法耗费大量人力,可扩展性差,算法性能依赖于训练样本的规模,具有明显的局限性。面向开放域的实体抽取和分类技术能够较好地解决这一问题,即对于任意给定的实体,采用统计机器学习的方法,从目标数据集(通常是网页等文本数据)中抽取出与之具有相似上下文特征的实体,从而实现实体的分类和聚类。
  2)关系抽取
  早期通过人工构造语法和语义规则,采用模式匹配的方法来识别实体间的关系。但这种方法工作量大,可扩展性差,因此采用面向开放域的关系抽取技术,直接利用语义中的关键词汇对实体关系进行建模,不需要预先指定实体关系的分类,比如面向开放域的信息抽取方法框架(Open Information Extraction, OIE)。现在OIE系统存在的主要问题是抽取的准确率以及系统对隐含实体关系的识别能力。
  3)属性抽取
  基于规则和启发式算法的属性抽取算法(百科类网站提供的半结构化数据是当前实体属性抽取研究的主要数据来源),如本体知识库(YAGO),其抽取准确率高达95%。
  4)知识存储
  当下的许多数据库采用关系型数据库对其进行存储,而在实际数据处理时所使用的数据却是图结构数据,Neo4j采用图结构的存储方式,在实际的数据处理过程中也是調用的图结构原始数据。且具有性能高、存储读写速度快、稳定性好等优点;在早期的文档、技术博客等图形数据库中运用较多,所以本文采用Neo4j来对图谱数据进行存储。
  4.人脸识别的实现
  通过直接调用已有的人脸检测/识别的免费开源API,如EYEKEY、虹软ArcFace、SeetaFace等。
  参考文献
  [1]刘峤,李杨,段宏,刘瑶,秦志光. 知识图谱构建技术综述[J]. 计算机研究与发展,2016,53(03):582-600.
  [2]肖明,邱小花,黄界,李国俊,冯召辉. 知识图谱工具比较研究[J]. 图书馆杂志,2013,32(03):61-69.
  [3]顾昭艺. 基于人脸识别的社交关系检索系统的设计与实现[D].北京邮电大学,2013.
其他文献
微型与微压均是压阻压力传感器制作中的难题,二者都要求就更难,作者应水工模型测量的要求开发了一种直径Φ5mm,量程1mH〈,2〉O,3mH〈,2〉O,测水且要背腔水密封的水工专用微型微压传感器。又应便携
摘 要: 研究航空发动机性能评价以及衰退预测的方法,能够有效提高航空发动机的运行质量。基于此,本文将分析航空发动机的性能评价方法,其中主要包括改正编辑距离评价验证、利用发动机公测数据评价验证以及航空发动机监控数据评价验证三方面内容。并研究航空发动机衰退预测的方法,其中主要包括过程模糊规则衰退预测法、公用数据衰退预测法以及发动机性能指标衰退预测法三方面内容。  关键词: 航空发动机;性能评价;衰退预
从今年3月中旬开始,我国实行多年的股票发行审批制已基本过渡到核准制。这对我国资本市场到底意味着什么? 实行核准制,意味着证券市场的法制建设取得了重要进展。这两年来,
在科研单位的固定资产中,基建项目具备专业性强、流程复杂以及建设周期长等特点,需要科学合理地进行基建项目的管理。基于此,笔者从基建项目管理的不足入手,提出了加强基建项目管
摘 要: 新高考改革给予了学生更多的自主权,同时也使高校生源呈现出多样性和复杂性的显著特征。本文基于这一背景,对掌握学习理论在高校教学改革中的应用展开分析。研究认为,掌握学习理论以公平的学生观为特征,以“每个学生都能学好”为核心观点,以诊断性评价和形成性评价为基本教学策略,高校可借鉴掌握学习理论,在教学目标体系的构建和分解、评价和矫正机制的强化等方面进行改革,以解决新高考背景下集体教学与因材施教之
该文报道全固体单频可调谐微型Nd:YVO激光器及其稳频特性研究成果。利用光外差光谱激光稳频技术,将Nd:YVO激光频率锁定在碘分子532mm波段吸收超精细结构谱线 上。该研究结果对
叙述了微型卤素GM管的结构参数对端效应和灵敏度的影响。
摘 要: 无人机飞行中控制系统基本的数据参考来源都在于对空速的测量,无人机空速需要在测量气流动压的基础上进行计算。为了保证无人机在飞行中不出现差错和问题,进行空速测算已经成为制约无人机飞行的主要牵制点,也成为分析无人机飞行的主要因素。本文主要针对空速的计算公式对传感器测量中造成的速度误差进行测量,提出无人机在飞行测试中的控制系统的精度与要求,进一步提出有效推动无人机飞行的有效方案,为军事发展及民用
摘 要: 热误差补偿的实施策略指的是根据热误差模型计算出的预测值,使用某种技术、通过某些裝置和机构,实现热误差补偿的具体方法措施。本文将对数控机床热误差补偿的几种常用实施策略做深入阐述,并对它们做研究比较。  关键词: 数控机床;热误差补偿;实施策略;研究比较  中图分类号:TG659 文献标识码:A  将热误差模型预测的补偿值反馈给数控机床,然后控制机床的各坐标轴做出相应调整,以实现提高加工精度