基于词频的场景关联实体推理研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:WANGZHHUO
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文景转换是通过计算机将客观世界认知场景的自然语言文本描述自动转换成其三维或者动画形态的可视化表达过程,其在人工智能、动画、教育以及军事等领域有着广泛的应用前景。现有文景转换系统生成的场景过于简单,只含有文本所描述的实体,对场景中隐含要素表达不充分,生成的场景真实性不足。首先,本文在现有文景转换与自然语言处理相关研究的基础上,阐述了场景的定义,给出了场景实体模型与场景实体词典的概念,为进一步研究奠定基础。其次,针对场景中隐含要素表达不充分的问题,提出了一种基于词频的场景关联实体推理方法。在现有的自然语言处理技术的基础上,对文本进行分词标注、语法以及语义分析、去噪等文本预处理,实现对文本中场景实体词信息的识别。本文基于互联网大量文档数据,利用词频分析获取场景关联实体词序列集,结合反文档频率优化实体词序列集,并通过实验验证了方法的有效性。然后依据词共现频率分析检验场景实体序列集发现存在场景类别混合问题,直接从词共现频率出发无法有效解决该问题。进而,结合统计数据,提出了最优场景关联实体集的推理方法。首先,分析了直接利用场景实体序列集作为场景关联实体推理结果所存在的问题,提出了融合LDA和最优主题数的场景类别分析方法。其次,通过设置权重阈值的方式对低TF-SIDF权重实体词进行过滤。从而实现了对场景核心实体词集、场景拓展实体词集与最优场景实体词集的构建,并利用最优场景实体词集构建了场景实体字典。最后,建立了实验原型系统。在构建可视化实体名词库、模型库基础上,利用java 3D图形技术,搭建实验环境,引入场景实体字典库,对比现有文景转换系统结果,证明了本文所提出的方法和技术路线的可行性以及有效性。
其他文献
近年来,随着辅助生殖技术的提升以及二孩政策的开放,双胎妊娠发生率升高。双胎妊娠存在更多风险因素,其染色体非整倍体的发生率高于单胎,使得双胎染色体非整倍体的筛查成为产
溶藻弧菌作为水产养殖主要的革兰氏阴性致病菌,给我国的经济发展造成了巨大的损失。本论文拟从生物学特性、转录水平、细胞毒性和减毒活疫苗四个方面,研究溶藻弧菌T3SS C-环
四氯化碳近年来在世界各地地表水与地下水中频频检出,它可能给人体带来的潜在危害也逐渐引起人们的关注。寻找一种有效的方法来处理被有机物污染的水体是十分必要的。本研究中,制备和表征了两种负载型纳米Ni/Fe双金属催化剂,并将其应用于处理水中四氯化碳的催化还原脱氯研究。考察了可能影响催化剂降解四氯化碳的因素(催化剂投加量、污染物初始浓度、反应温度和溶液初始pH等)及其反应动力学,探讨了四氯化碳催化还原脱氯
人脸识别技术由于在身份认证、公共安全、商业和银行等领域有着广泛的应用前景,近几十年来一直是计算机视觉和模式识别研究的热门课题之一。在众多人脸识别方法中,基于线性表
目的:通过观察温阳益气活血方对慢性心力衰竭患者临床症状、心功能及实验室检测结果的影响评价该药对慢性心力衰竭的临床治疗作用;采用基因芯片技术观察该方对慢性心力衰竭患
肿瘤微环境抑制因素导致抗肿瘤免疫的主力军——T淋巴细胞在肿瘤组织浸润减少、功能异常。痘病毒是一种溶瘤病毒,可以感染肿瘤细胞,诱导免疫原性细胞死亡,激活抗肿瘤免疫应答
脉冲微分方程在航空航天、控制系统、生物学、医学、经济学等众多领域有广泛应用.由于其理论解一般很难获得,因此其数值方法的研究具有毋庸置疑的重要性.当前对脉冲微分方程数值方法稳定性研究已有众多成果,但收敛性研究相对较少.有鉴于此,本文重点研究脉冲微分方程数值方法的收敛性,获得了求解非线性脉冲常微分方程及一类非线性脉冲比例延迟微分方程Runge-Kutta方法的经典收敛结果(针对非刚性问题)和B-收敛结
目的:探讨青海地区藏、汉族心房颤动患者与VKORC1基因1639位点及CYP2C9基因多态性的关系。方法:收集青海地区藏族房颤患者50例,汉族房颤患者50例;同时,在同一时间段随机纳入
过度使用抗生素已成为全球严重的生态问题。近年来,国内外已经报道了关于针铁矿吸附各种抗生素的研究。但是,随着越来越多的人工纳米颗粒应用于各个领域,它们已经在环境中被检出,特别是纳米银颗粒和纳米二氧化钛颗粒。抗生素和人工纳米颗粒能够在环境中共存,例如医疗废水、污水处理厂污水及污泥中。因此,有必要研究共存的纳米颗粒和抗生素进入土壤环境时,在针铁矿上的吸附行为。本实验选择柠檬酸盐包覆的纳米银颗粒(Citr
[目 的]通过探讨FXS模型小鼠社交行为异常的分子机制,加深对FXS病理机制的认识。通过AAV介导FMRP在Fmr1 KO小鼠大脑神经元的获得性再表达,为FXS的基因疗法提供参考和依据。[