双语影视知识图谱的构建研究

来源 :北京大学学报(自然科学版) | 被引量 : 0次 | 上传用户:wafh000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种双语影视知识图谱(BMKG)的构建流程。通过半自动化的方法构建了双语影视本体(BMO),将各个影视数据源对齐到BMO,以保持异构数据源的语义描述一致性。在知识链接方面,在充分挖掘和利用领域特征的基础上,采用基于Word2Vec和TFIDF两种向量模型的实体相似度计算方法,使相似度特征增加一倍,大大提升了模型的链接效果。在实体匹配方面,提出基于相似度传播算法的实体匹配算法,并利用影视数据源之间的内在联系,克服了跨语言实体之间计算相似度的语言障碍。实验结果表明,当阈值取到0.75以上时,实体匹配的准确率都能达到90%左右。此外,还建立了影视知识图谱共享平台,并提供开放性的数据访问和查询接口。
其他文献
[摘 要]语言训练是语文教学的基础。语文教师要在深入研读教材中关注文本表达,凸显文本内容和语言形式的内在联系,捕捉文本中的教学价值,找准语言的训练点,让学生反复模仿训练,从而学有所得。  [关键词]关注;文本;训练  谈到语言训练,我们往往将其与机械重复、题海战术划上等号,认为与素质教育背道而驰,因此成为了语文教学的忌讳。面对这一现状,需要我们静静思索,重新审视。  语言文字训练,具体地说就是“字
高校食堂是学生及教师的就餐场所,满足学生及教师日常生活的基本需求。但,当前高校食堂管理模式,仍旧面临一些问题,包括排队、效率和浪费等问题,逐渐不能满足师生的基本需求
<正>1简单问题选题是决定作业讲评效率高低的重要因素之一.不少教师喜欢选取一些高考试题中的压轴题.压轴题是高考试题的精华部分,具有知识容量大、解题方法多、能力要求高、
<正>3"禁售"传统能源汽车对新能源汽车市场的影响前段时间,斯坦福大学经济学家托尼·西巴的一份题为《反思交通运输2020-2030》的报告引发了大家的广泛关注,这份报告大胆预测
随着列车运行速度的不断提高,对其制动能力的要求也越来越高,但目前传统制动装置尚无实质性的设计改进.根据206型客车转向架制动梁的结构特点,基于TB/T 2400—1993车辆制动梁
针对三自由度光电跟瞄平台系统状态不可完全观测的特点,进行可观测结构分解。对可观测部分设计H∞滤波器,并结合状态反馈H∞稳定控制对所设计的H∞滤波器进行仿真研究。结果
在对平邑县城北第三水厂供水工程项目水文地质条件分析的基础上,明晰了项目所在地地下水的补给、径流、排泄条件主要受地质构造、地形地貌和水文气象等因素的控制,补给来源主
[摘 要]实现课堂教学高效的关键在于引导学生积极进行课堂展示,上好展示课。上好展示课的关键则在于教师课前的正确引导和学生的有效自学。  [关键词]课堂教学;高效;展示  建设高效课堂,实现教学高效的关键在于引导学生积极参与课堂学习,主动进行课堂展示,即组织学生上好展示课。展示课上得好,才能真正体现出学生是学习的主体,课堂的主角。但展示课只是学生学习结果的体现,真正的学习并不只是在展示课上,更多的是