【摘 要】
:
随着人工智能、大数据技术和计算机硬件的不断发展和升级,越来越多的人都在享受着科技带来的便利,也催生了许多新兴的产业,如无人驾驶、智慧城市、智能医疗等;与此同时各种类型的数据尤其是医疗行业数据的指数型增长,也给数字化存储和诊断提出了新的要求,在未来相当长一段时间内,依托于机器学习以及深度学习方面的不断进步,以医疗数据为支撑的多学科交叉融合研究仍然是当前新兴技术产生和工程应用中非常重要的一环。过去的两
论文部分内容阅读
随着人工智能、大数据技术和计算机硬件的不断发展和升级,越来越多的人都在享受着科技带来的便利,也催生了许多新兴的产业,如无人驾驶、智慧城市、智能医疗等;与此同时各种类型的数据尤其是医疗行业数据的指数型增长,也给数字化存储和诊断提出了新的要求,在未来相当长一段时间内,依托于机器学习以及深度学习方面的不断进步,以医疗数据为支撑的多学科交叉融合研究仍然是当前新兴技术产生和工程应用中非常重要的一环。过去的两年时间里,对我们自身以及世界上任何一个国家和民族来说,都是非常艰难的一段时期,医疗资源的短缺,医生数量的不足在来势汹汹的新冠肺炎面前这些问题变得更加明显,更加突出。我们知道,医学检验单在医院检查的各项项目中是非常普及的,每家三甲医院每天都会产生大量的检验单数据。如果这些数据全都由在职医生去一一解读的话,无疑会很大程度上耗费医生和患者的宝贵时间。为了更好的辅助医生和患者了解自身身体状况。针对以上问题,本文提出基于深度学习的方法对医学检验单进行智能检测识别和结构化输出的过程。相比于之前的传统OCR方法,深度学习在算法设计上变得相对简单,避免了繁杂的字符特征设计问题,并且可以很好的应用到各种复杂场景,去识别汉字、英文、数字、或者一些特殊符号等。通过对目前主流的图像预处理、图像文本检测和识别以及识别结果的重新排版分析技术的了解和学习,我们发现目前针对用户在自然场景下拍摄上传的各种图像,还远远没有达到想要的识别结果,由于在自然场景下图像拍摄受外界环境影响比较大,面临的挑战很多,像图像质量差、背景复杂、低分辨率扫描、文本结构化形式多种多样、字符间距长短不一、检验单的隐私化、图像中包含汉字、英文和各种字符等问题。基于用户上传图像形式复杂多变,本文首先通过传统的数字图像处理自适应或者启发式的算法来优化图像的前景表达和抑制无用噪声,然后在多尺度融合的特征金字塔网络基础上加入可微分的二值化函数进行端到端多方向文本检测,同时利用已有的先进的深层卷积循环神经网络模型在不同的数据上进行迁移学习实现多种类型字符串识别,并在实验过程中不断对模型进行微调以及应用一些在线训练模型技术来弱化真实检验单上所带有的一些类似字符的干扰信息和固有视角偏差,还要通过模型转换使得各深度学习库所训练出来的模型可以有效结合,最后为便于以后分析,还要对识别出的文本结果进行重新排列和关键信息选取,过滤掉无用信息,更好的规范化验单项目的有效结果,通过推理加速和多线程技术进行模型优化和有效部署。实验结果表明,基于所收集到的检验单数据集,本模型可以在检测、定位和识别任务的一定指标上优于之前主流的算法。
其他文献
三维面形测量技术在光学测量中起着重要作用。与接触式测量技术相比,三维面形测量技术可以通过分析条纹图样,获得物体信息,实现非接触式测量复杂物体面形,并恢复物体的形态特征。随着科学技术的发展,各个领域的相关研究人员对测量方面的需求在不断增长,三维面形测量技术成为高精度获得物体三维面形分布的主要途径之一,测量对象通常包括静态物体和动态物体,测量系统采用结构光照明,一般由一个投影单元和一个或者多个摄像机组
梁振动方程在桥梁建设,土木工程,噪声控制和航空航天等方面有广泛应用,带有阻尼项的梁振动方程可以更好地描述物体的特殊性质,特别是时间分数阶阻尼梁振动方程,可以更有效地刻画物体的记忆性和时间依赖性,因此,对阻尼梁振动方程的研究具有重要的理论意义和实用价值.紧致有限差分方法可以使用较少的网格节点以获得较高精度,大大减少了计算量.本文对整数阶阻尼梁振动方程提出了一种三层紧致差分格式,对分数阶阻尼梁振动方程
鱼类是变温动物,自身缺乏体温调控系统,体温会随着水体温度的变化而变化。温度是鱼类生长过程中一个非常重要的非生物因素,影响鱼类的各项生命活动。应对低温压力,鱼类会产生三级响应。鱼类是研究温度对免疫影响的理想模型,具有完整的脊椎动物免疫系统,包括天然免疫和适应性免疫。目前,关于鱼类如何应对低温胁迫以及适应低温的分子应答机制的研究尚不明确,低温具体影响的免疫相关基因及机制还有待探究。本论文以斑马鱼为研究
热活化延迟荧光(Thermally Activated Delayed Fluorescence,TADF)材料凭借其激子利用率高、成本低、对环境友好等优点在有机发光二极管(Organic Light Emitting Diode,OLED)的发光层材料中占据领先地位。近年来,TADF发光材料发展为具有聚集诱导发光(Aggregation Induced Emission,AIE)、激发态分子内质
长链非编码RNA(long non-coding RNAs,lncRNAs)是一类新的调节性RNA,其长度超过200个核苷酸,几乎没有蛋白编码能力,它们通过各种机制(例如表观遗传途径,染色质修饰,与DNA、RNA或蛋白质的直接相互作用)参与基因沉默或激活的生物学过程。有研究者不断发现新颖的lncRNAs作为癌症(如:结直肠癌、乳腺癌和胃癌等)发病机制中的抑癌基因或致癌基因。LncRNA的过表达和低
近年来,人工碱基在遗传学上的成功应用,极大地促进了合成生物学的发展。人工碱基相关结构和性质的研究,对于探索可能的多组成、多形态的生命形式以及拓展DNA分子的信息存储能力起着至关重要的作用。2019年,Benner等人的研究发现,新合成的人工碱基(ZP和BS)能够像天然碱基那样相互识别与结合,并且能够形成自我维持稳定的双螺旋结构。此外还发现,包含ZP的DNA链表现出与天然双链不同的性质,其可以更好地
纸芯片分析装置(Microfluidic Paper-based Analytical Device,μPAD)是近些年来发展的一种新型微流控芯片技术。与传统的硅、玻璃、高聚物等材料相比,纸的成本低、制作简单、使用和携带方便,并且基于纸的微流控芯片可以将条形纸测试的优点与常规芯片实验室的分析检测功能相结合。因此,这种分析装置被称为纸上微型实验室,也被称为微流控纸分析器件,并且作为一次性分析器件在生
清末是中国传统文化和西方现代文化碰撞交融的大变革时期,是物理课程正式纳入我国国家课程体系的时期,也是我国第一部具有完整意义的物理教科书的诞生时期,更是我国传统物理教育走向近代化的转型时期。以史为鉴,可以知兴替,本研究选取20世纪以来11个时期的12套样本教科书,从宏观、中观以及微观三个层面,对教科书中的电磁学部分进行梳理分析,科学地总结清末以来我国高中物理教科书中电磁学内容的变迁特点,理性分析其变
为了适应半导体芯片电子元件尺寸不断减小的变化趋势,在纳米尺度上以分子为单元构筑分子电子器件的器件小型化策略被提出。在对功能性分子器件的研究过程中,人们发现以电子的自旋为信息载体,可以设计出分子自旋电子器件,这类分子器件在信息处理、数据存储、信号传输和能量消耗等方面具有进一步的优越性能。到目前为止,多种多样的功能性分子自旋电子器件在理论和实验上被设计、制备并研究。研究表明,分子器件可以通过某种方式进
信访是联系政府和群众的桥梁和纽带,长期以来,信访承担着联系群众、民主监督、调节矛盾、反馈民意、综合协调的重要功能。但是随着中国经济社会的转型发展,社会环境不断发生变化,各类社会矛盾频发,人民群众的民主意识和维权意识日益增强,信访发挥着越来越重要的作用。当前,随着互联网的普及及数字信息化时代的到来,仅靠传统的信访模式已难以适应社会转型和社会治理观念转变的需要,网上信访作为一种新型的信访模式,是新时期