【摘 要】
:
数学表达式特有的多种数学符号排列组合而成的空间层次结构,成为其区别于普通文本的重要标志,使数学表达式检索成为信息检索领域的难点,亟待研发能够良好适应数学表达式特征的检索理论与方法。通过对数学表达式特征的分析与归纳,对数学表达式检索模型的特征提取、索引构建以及匹配和排序等关键问题展开研究,设计了一种基于运算符特征的数学表达式检索方法,并对其加以扩展,利用犹豫模糊集在解决多属性、多隶属度分类问题上的优
论文部分内容阅读
数学表达式特有的多种数学符号排列组合而成的空间层次结构,成为其区别于普通文本的重要标志,使数学表达式检索成为信息检索领域的难点,亟待研发能够良好适应数学表达式特征的检索理论与方法。通过对数学表达式特征的分析与归纳,对数学表达式检索模型的特征提取、索引构建以及匹配和排序等关键问题展开研究,设计了一种基于运算符特征的数学表达式检索方法,并对其加以扩展,利用犹豫模糊集在解决多属性、多隶属度分类问题上的优势,提出一种基于犹豫模糊权重的数学表达式检索模型。首先,提取数学表达式的子式结构,构建子式特征码;然后,对数学表达式子式的长度、运算符数目、子式所在层次进行综合犹豫模糊隶属度评估,为各子式分配犹豫模糊权重值并将其加入倒排索引,在检索时对目标表达式做相同解析处理;最后,通过权重值累加的方式计算犹豫模糊相似度得分,并将检索结果有序输出,实现数学表达式检索。在从数学信息检索领域公共数据集中得到的31742篇科技文档与519588个LaTeX数学表达式上进行了实验,结果显示所提出方法的检索时间在可接受范围之内,排序合理性指标最大值为0.811,表明本文基于犹豫模糊权重的数学表达式检索模型能够较合理地检索数学表达式。
其他文献
半导体纳米晶的光学性质在近些年来引起了相当大的关注。部分纳米晶已经成功应用在激光、荧光生物医学探针等量子器件上。CdSe纳米晶因其窄带隙和卓越的光学性质,成为广泛研究的半导体纳米晶。同时核壳结构的半导体纳米晶也是材料领域研究的主要对象。研究者发现在CdSe核表面外延生长CdS壳层可以显著提高其光致发光效率以及化学和热稳定性。由于压力可以改变纳米晶的电子和晶体结构,利用高压装置对核壳半导体纳米晶进行
NO_2近些年来成为困扰人类的一种有害气体,过量的NO_2是导致酸雨、地表水酸化和富营养化的重要原因。半导体气敏传感器则是检测大气中NO_2浓度的重要手段之一,备受研究人员青睐,而半导体气敏传感器的核心就是制作传感器的半导体材料。ZnSe是一种非常重要的宽禁带Ⅱ-Ⅵ族半导体材料,在可见光(400700 nm)范围内的光电催化及光电转化特性性能十分优异,在激光、全天候光学装置、红外热成像、高分辨率的
关键词识别指在连续语音流中检测出预定义关键词。由于深度神经网络在语音识别方面有着突破性发展,近年来关键词识别的研究主要是基于语音识别展开的。这类方法首先使用声学
全球变暖背景下,城市热岛效应(UHI)对居民生活和健康的威胁进一步扩大。在夏季,长期居住在稳定的热岛中心的居民具有极高热相关健康风险。定义连续多年夏季受热岛影响,且面积较大、连通性较好的高温中心为长期热岛。以北京六环以内区域为例,利用三期Landsat数据,结合形态学空间格局分析和叠加分析等方法,识别了北京市2011-2017年的长期热岛空间分布并依据土地利用情况对其进行类型划分。通过景观组分与地
全球气候变化及快速城市化加剧极端事件的发生频率,高温热浪作为其中的典型效应,对城市生态环境及居民健康造成极大威胁。由于城市内部热环境风险并非均质分布,依据城市内部功能类型及人类活动进行针对性研究,对更精细尺度上气候变化适应指引实践意义重大。本文以北京市为例,结合POI数据、手机信令数据划分城市功能区,基于职住功能视角,识别与人类活动最为频繁与居民日常生活最为密切相关的居住、工业、办公功能。通过“暴
近年来,人们一直致力于探索新材料和新能源的开发,以满足当今社会的高速发展和可持续发展的需求。金属二氮烯氮化物因同时具有含能性质和导电性质而具有十分广阔的应用前景。然而,我国关于金属二氮烯氮化物的研究还处于起步阶段,还有很多问题需要研究探索,比如金属二氮烯氮化物的合成制备、高压下的相变规律、还有导电机理等等。本论文在课题组前期对碱土金属叠氮化物的研究基础上,在高温高压的条件下,通过控制碱土金属叠氮化
近年来,随着自动语音识别(ASR)技术水平的提高,从ASR系统输出得到的口语转录文本的处理研究,也随之受到了广泛的关注。由于口语转录文本并不是书面化的文本,从而会带来一系列严重的问题。一方面,口语转录文本是由ASR系统输出生成的一串字符流组成的,缺少标点符号和句子边界信息。这就是导致了读者在阅读转录文本时,很难找到一个句子的起点和终点,从而大大增加了句子语义的理解难度。另一方面,口语转录文本包含了
高压可以通过改变物质内部的化学键,将机械能以相变的方式储存在物质内部,并在适当的外界条件下将能量释放出来,通过高压的方式来合成高能密度材料是含能材料研究的一个重要思路。聚合氮是高压合成高能量密度材料的代表,但是聚合氮生成条件十分严苛,产物也不易保持到常规条件。一氧化碳与氮气具有相同的分子量和核外电子数以及相似的结构,而且实验已经验证其在高压下可以聚合,探索聚合一氧化碳压制聚合的热力学路径,产物主要
近年来,气候变化对于全球影响加剧,气候变暖问题愈发受全球各界的关注,找到气候变化的影响控制因素,揭示气候演化的规律,预测气候变化趋势已经成为当前气候研究学者们的共同理想与终极目标。帝汶海位于印度-太平洋暖池区南部,地处西太平洋暖池区西南部,印度尼西亚穿越流贯穿其中,沟通印度洋与太平洋,调节着两大洋之间的水体和热量输送,同时,暖池区气候变化也会间接或直接地对高纬地区乃至全球的气候变化产生重要影响。本
InSb是一种窄带隙材料,它具有大的朗德g因子,高室温迁移率和大的自旋轨道相互作用。鉴于其优越的材料特性,InSb体材料以及InSb量子阱器件在新电子器件[1][2]和磁阻器件[3][4]的研发以及自旋电子学[5]研究中都引起了人们的广泛关注。通常半导体异质结结构的自旋轨道耦合效应来自于两种不同的反演不对称性:结构反演不对称性和体反演不对称性。体反演不对称性是由于两种不同元素组成的闪锌矿结构化合物