【摘 要】
:
在对科技信息需求与日俱增的今天,科技信息检索方法层出不穷。数学表达式相似度计算是科技信息检索研究中的一项重要内容,但因数学表达式具有复杂的二维空间结构,使其不能完全适应于传统的文本相似度计算方法,充分利用数学表达式结构特征对数学表达式进行相似度计算成为一个亟待解决的问题。通过对数学表达式二维结构特征的分析,基于对数学表达式结构特征在相似度计算中作用的研究,提出一种基于SOM聚类反馈的数学表达式相似
【基金项目】
:
河北省高等学校科学技术研究项目(项目批准号:2019131);
论文部分内容阅读
在对科技信息需求与日俱增的今天,科技信息检索方法层出不穷。数学表达式相似度计算是科技信息检索研究中的一项重要内容,但因数学表达式具有复杂的二维空间结构,使其不能完全适应于传统的文本相似度计算方法,充分利用数学表达式结构特征对数学表达式进行相似度计算成为一个亟待解决的问题。通过对数学表达式二维结构特征的分析,基于对数学表达式结构特征在相似度计算中作用的研究,提出一种基于SOM聚类反馈的数学表达式相似度计算方法。首先,将数学表达式解析为数学表达式树并获取相关节点信息,在三种哈希算法处理的基础上使用Jaccard算法对表达式相似度进行初始的计算。然后,针对结构特征在数学表达式相似度计算中利用不全面的问题,使用多个结构指标对数学表达式进行评价,据此定义数学表达式权重分配规则,使用SOM神经网络对权重向量聚类,得到数学表达式结构指标评价簇以及结构指标评价分类器,用于对表达式所属簇的判定。最后,为体现结构特征在相似度计算中的作用,以结构指标评价分类器对查询表达式与初始相似度结果列表中表达式的判定结果为依据,使用遗传算法对相似度计算中相关参数进行动态调节反馈,得到最终的相似度计算结果列表。在NTCIR公共数据集中提取到的373615个Math ML-Content格式的数学表达式上进行了实验,并将本方法应用于实验室采集的实际样本数据集中。结果显示所提出的相似度计算方法的计算性能评价指标F1的平均值达到了0.842,相较于基于哈希的数学表达式相似度计算方法提高了8%,本方法对数学表达式相似度的计算性能较好。
其他文献
维生素B12(Vitamin B12,VB12)又叫钴胺素,其外观因含有金属钴元素而呈深红色。动物源内脏中含有大量的维生素B12,在牛奶、鱼以及蛋黄等食品中也有较为广泛的存在。植物体内不含维生素B12。人体自身无法合成维生素B12,但是许多微生物如根瘤菌,放线菌以及肠道细菌等可以合成。维生素B12是维生素产品中价格最昂贵的品种之一。它能参与到血细胞发育的活动中,并且在生物体的代谢活动中也有它的身影
介质阻挡放电是一个典型的空间延展性非平衡系统。在放电过程中,放电气隙内的空间电荷与电介质表面积累的表面电荷具有不同的局部动力学行为,两者之间相互作用,产生了种类繁多的时空斑图。基于该特点,本论文建立了一个双层耦合非对称反应扩散系统模型来唯象地描述该介质阻挡放电系统中自组织斑图的形成机制以及动力学行为。线性耦合两个具有不同动力学行为的反应扩散模型,构建一个双层耦合非对称反应扩散系统模型对介质阻挡放电
本文主要讨论了几类集值微分方程的稳定性,集值微分方程作为微分方程理论的发展,已有许多学者对集值微分方程理论进行了深入的研究.在对集值微分方程的研究中,当集合是单值映射时,集值微分方程中的Hukuhara导数和积分可简化为普通的向量导数和积分,因此常微分方程是集值微分方程的特殊情况;其次,当多值微分包含不具有凸性时,可以将多值微分包含转化为集值微分方程来考虑,因此集值微分方程可以作为研究多值微分包含
在模糊系统中,由Liu过程驱动的模糊微分方程是研究动态系统的有力工具,从而对此类模糊微分方程的求解也成为一项重要课题.得到方程的解析解即精确解是最理想的结果,因此,本论文首先讨论模糊微分方程的解析解,得出非线性模糊微分方程的可约条件以及可约模糊微分方程解析解的求解方法.然而仍有大多数模糊微分方程解的解析表达式无法得到,所以本文主要对由Liu过程驱动的模糊微分方程进行数值解研究.对模糊环境下的Tay
首先对特征为零的代数闭域F上n-李代数L定义了Near Perfect理想和最大Near Perfect理想NP(L).研究了NP(L)和下降中心列的关系,商代数L/NP(L)的结构,以及Near Perfect乘积.主要结论有:1)NP(L)是L的下降中心列中的最小项;2)商代数L/NP(L)是幂零的;3)非零的Near Perfect理想存在一组正规Near Perfect乘积.然后研究了具有
经典测度论是源于测量客观世界中物质的长度、面积或体积的度量几何学.经典测度与积分理论的建立,对数学的许多分支的发展起到了十分重要的作用.然而,由于客观事物本身所具有的模糊性和非可加性,使得人们经常会遇到一些不能用经典测度与积分理论解释的问题.使得基于经典数学的测度与积分理论产生了局限性.由此产生了基于模糊数学的测度与积分理论,该理论广泛应用于过程控制、模糊优化、决策论、金融和经济等问题的研究中.本
半无限规划是指约束个数无限或约束条件无限的优化问题,而在现实生活中,往往存在由于数据的缺失,波动等因素引起的决策变量的不确定性问题,从而产生了鲁棒半无限优化问题.这类问题由于其变量带有不确定信息以及约束条件的无限性,对其直接求解十分不易,因此为了更好的研究此类问题,本文针对鲁棒半无限规划的对偶性进行了相关讨论和分析.本文主要内容包括三方面.首先,利用Fourier-Motzkin消元法讨论了线性半
以新浪微博为代表的新型社交媒体逐渐取代传统媒体,成为人们获取信息,传播信息的主要平台。这些平台使人们的生活更加便捷,但同时也成为了各种谣言信息广泛传播的温床。谣言的传播给人们带来巨大的经济损失,造成严重的社会恐慌。如何快速且有效地自动检测微博等社交媒体上的谣言信息,成为了当前社交网络研究中的热点。现有的微博谣言检测研究,大多都将其看成有监督学习的二分类过程。特征的选取是研究中的重点,主要包括博文内
本文针对半无限规划进行了两方面的研究.一方面,从理论上研究了半无限规划的对偶理论.首先,针对广义凸和高阶(Φ,ρ)-V-广义凸的半无限规划问题,分别以Wolfe型对偶和Mond-Weir型对偶为例,证明了弱对偶性、强对偶性以及严格逆对偶性.然后以Lagrange型对偶为例,讨论了非凸半无限规划的对偶理论,构造了一个新的增广拉格朗日函数.在合理的假设下,原问题和增广拉格朗日对偶问题之间的强对偶定理成
1991年,Luksch等提出一种新的“概念”结构—经典半概念.经典半概念单向地讨论了对象与属性之间的关系,放宽了形式概念分析中算子的限制条件.该理论一经提出,得到许多研究人员的关注.然而,经典半概念只研究了对象与属性之间的确切关系,但实际应用中也存在模糊关系的情况.受二支决策思维方式的影响,经典半概念与其他理论结合的研究较少,进而使经典半概念的发展受到了影响.为了丰富经典半概念,将思维方式从二支