面向零售票据图像的感兴趣字段提取算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:reap
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网正在快速发展,它所承载的信息量也在指数级增长。传统的人工筛选信息的方法已经很难满足实际需求。因此,如何对这些信息进行快速地自动化处理就显得尤为重要。对于纯文本信息,已有诸多成熟的方案可以提取出其中的关键部分。对于嵌入图像的文本信息,传统的方法是利用文本识别技术将文字提取出来,然后再对内容进行分析。但随着智能手机的普及,大量嵌入图像的文本信息通过手机拍摄的方式记录,这样的图像不具备扫描图像中文字清晰规整的特点。因此,对于拍摄图像中的信息,传统提取方式没有考虑到拍摄图像这一载体的特殊性,导致一些文本无法被准确地理解。零售票据图像是嵌入图像文本信息的一种实例,为了更好地提取出票据图像中的信息,本文结合了不同类型的特征,从两个侧重点分别实现了感兴趣字段的提取算法。本文首先从票据图像中抽象出语义、视觉、结构以及规则四类特征表示。其中语义、视觉、结构三类特征可以通过不同深度学习方法训练得到,规则根据零售票据的特点制定。将这四类特征进行融合,融合后的特征经过标准化,以便不同单位或量级的值进行比较和加权。票据的字段间存在独特的组织结构,针对这一特点,本文提出了基于融合特征的图卷积票据感兴趣字段提取方法。该方法将文本框作为图的节点,融合特征作为节点的特征表示,利用文本框间的位置关系和文本内容相似度建立边的连接,并使用图卷积网络对票据图进行推理和学习。该方法在中文零售票据数据集上训练,并与其他三类基于图神经网络的方法进行对比,实验结果表明,本文方法获得了图神经网络实现中的最优效果。提取算法在实际应用时需要具备可靠性与稳定性,因此,本文又从增加模型不确定性和鲁棒性的角度提出了基于融合特征的贝叶斯深度票据感兴趣字段提取方法。该方法将长短期记忆网络的输入序列和融合特征进行拼接,并将网络中的权重参数从固定值转换为概率分布。此外,分类网络输出的感兴趣字段还会经过后处理的步骤,使得结果更加准确。最后,与多种基线方法的对比结果表明,本文方法在中文零售票据数据集上的多分类准确率相比最优的基线模型提升了1.69%,Weighted-F1指标提升了1.49%。
其他文献
目的探讨母体孕早、中、晚期及脐血血清中7种炎症因子浓度与学龄前儿童智力发育水平之间的关联,揭示关联的敏感期及其性别差异,为预防儿童智力发育损伤和发育起源性疾病的发生提供理论依据。方法本研究依托马鞍山优生优育队列(MABC),最终纳入1 641对母子对进行分析。在母亲孕早、中及晚期产检时采集空腹外周静脉血,并在分娩时采集脐血,使用Luminex液相悬浮蛋白技术检测样本血清中7种炎症因子浓度,包括干扰
学位
购物小票票据是线下消费过程由商户提供给消费者留存的购物凭证。由于线下零售销售系统的独立性,海量线下消费数据被不同品牌、商铺形成的“信息孤岛”所隔离。在此背景下,对购物小票票据进行数字化信息结构抽取可以为智能零售提供针对商品运营和供应链优化的精准数据分析。传统光学字符识别(Optical Character Recognition,OCR)系统在扫描文档图像的文本检测和识别任务上表现优秀。但是,由于
学位
中长期的天气预报主要是指两小时以上的天气预报,其在灾害预警、降水估计、农业灌溉和交通规划等领域都有着重要的应用价值。而中长期的天气预报主要依赖于卫星云图预测任务,它是时空序列预测的一种应用场景。但由于卫星云图序列运动规律计算困难且预测时间长,该预测任务具有极大的困难与挑战。传统的光流法和交叉相关法都是建立在理想的条件下,对卫星云图的复杂运动系统难以预测。而近年来基于深度学习的时空序列预测算法在处理
学位
近年来,微软小冰、天猫精灵等聊天机器人的研究与运用得到快速发展,并开始扮演着重要的角色。除了进行正常的自然语言理解与生成外,拥有情感理解与同理心对话能力是聊天机器人的重要特征。合理有效的同理心回复可以带来更好的用户体验。现有的同理心对话方法主要采用多任务学习框架,在情感分类的同时进行回复生成,取得了不错的效果,但仍存在一些问题。一方面现有方法通常只利用了部分情感信息,却忽视了其他与对话相关的状态信
学位
近两年,随着新冠肺炎防疫逐渐常态化、医疗资源短缺与地区不平衡现象愈发突出,线上问诊研究逐渐成为热点。医院内医患问诊对话文本蕴含大量诊断指导信息,如何挖掘问诊对话数据中的逻辑,并以此实现对话自动诊断是一个具有科学研究价值和实际应用场景的研究方向。当前对话策略研究将患者的症状、检查信息标准化,和疾病信息共同构成医生的动作集合,将整个对话过程建模为序列决策过程,使用强化学习来模拟医生诊断过程。这种建模方
学位
目的本研究旨在评价围产期双酚AF(bisphenol AF,BPAF)暴露(0、0.34、3.4和34 mg/kg/bw/day,对应于对照组、低、中、高剂量组)可能会导致的成年小鼠后代认知功能的影响,同时通过氧化应激和突触可塑性蛋白表达水平的变化探究其是否与成年子代认知功能的影响相关,探讨其简要机制。还探讨了海马雌激素受体(estrogen receptors,ERs)的改变,以解释低、中剂量B
学位
目的本研究基于合肥市母婴健康出生队列(MIH-Hefei),分析妊娠期糖尿病(Gestational diabetes mellitus,GDM)的诊断时间与胎儿宫内生长、新生儿出生形态和婴儿体质指数(BMI,Body mass index)生长轨迹变化的关系,并进一步探讨孕母的孕前期体重过度增加和炎症水平在上述关联中的作用。方法2015年3月至2020年12月,在合肥市三家医院共招募定期产检的孕
学位
随着社交网络平台的普及,网络用户得以在社交平台上浏览感兴趣的问题,并附上与自己的看法或立场相关的主观性评论。对这些评论数据进行分析,可以了解和引导社交平台上人们舆论发展的趋势,具有重要的研究价值和产业应用前景。问答立场检测目的是识别用户回答对问题中观点所持有的立场倾向,即支持、中立和反对。现有的问答立场检测方法主要包括基于机器学习的方法和基于深度学习的方法。基于机器学习的方法重点在于人工特征构造上
学位
目的 了解糖尿病儿童青少年血糖控制的现状及其影响因素,探讨自我管理行为在抑郁症状与血糖控制关联中的中介作用,为糖尿病儿童青少年疾病的管理与治疗提供科学理论依据。方法本研究采用便利抽样的方式对前来安徽医科大学第一附属医院、安徽医科大学第二附属医院、安徽省儿童医院和安庆市立医院四家三级甲等医院就诊的糖尿病儿童青少年进行问卷调查,共207例患者最终纳入分析。问卷内容包括一般人口学特征、糖尿病相关信息、抑
学位
目的描述安徽省育龄夫妇40种抗生素及两种代谢物的分布特征和共暴露模式,评估夫妇低剂量持续暴露于抗生素的累积健康风险评估,探索夫妇暴露水平的相关性及其影响因素。方法本研究纳入来自育龄夫妇生殖健康-安徽队列的1 500对育龄夫妇作为研究对象,于2019年08月—2020年08月采用自编的基线问卷收集纳入夫妇的人口统计学信息、生活方式和饮食习惯等信息。同时采集他们的尿样并分装冻存在-80℃冰箱。从已完成
学位