论文部分内容阅读
摘 要: 科学技术飞速发展,信息技术的进步也是日益渐升,作为一种运用灵活的技术--语音识别技术,其在语音识别的应用上日益成熟,在医学领域大放异彩,医疗信息方面的应用已经相当熟练地结合了语音识别技术及信息技术,语音识别技术为医疗信息化提供更高效的服务。本文在语音识别技术的基础上结合Microsoft Speech SDK技术,探讨其在影像科诊断报告中生成系统的研究及设计。结果显示其应用效果甚佳。
关键词: 语音识别技术;Microsoft Speech SDK;影像科诊断报告
【中图分类号】 R197.324 【文献标识码】 A【文章编号】 2236-1879(2018)12-0201-01
日常生活中,在就醫的过程中,医生提供的医疗诊断单子都是专业的诊断术语,不同的数据检查结果并不能让我们对疾病有清楚的认知,而是需要医生的讲解。据数据统计,任何一家中大型医院的临床检查科室专业人员书写的诊断报告中,就有60%~70%的书诊断报告布满了"天文字符",一般人即便看不懂也能发现其重复率几乎是一张诊断报告的一半。而构成那些"天文字符"的也只是一些词汇。这样的现象在科技信息的发达今日已经随着医疗设备的更进在慢慢改善,其他行业在信息化、数据化中逐渐呈现出更加快捷高效的状态,医疗领域也不例外。一、语音识别技术发展的必要性调查报告显示,大部分正规设备较为完善的医院,每天的病人流动数量的都在不断的变化,病人的病情也跟着流动,诊断数据也在不断更新,这就意味着负责生成诊断报告的工作人员需要在有限的时间内将患者的各项资料进行数据化处理,并生产诊断报告。
当下计算机技术已经相当成熟,不仅仅只是在科学领域,包括医疗也有自己一套强大的计算机技术使用方法,无论是在公众号预约挂号,还是一个医院的信息系统,都在计算机技术的囊括之下,信息的录入、对图像的整理分析以及传输系统的整合,都是医院在计算机技术下的信息化、数字化的表现趋势,一个医院的等级已经体现在计算机水平的高低上了。但是即便如此,大量的诊断报告输入仍然需要人工去实现完成,也就是说,在计算机技术的基础上需要去开发一个语音识别系统来识别小词汇,继而使重复率高的诊断报告得到改善且快速录入,提高相应的工作效率,减轻工作人员的大量的键盘输入工作量,从而使整个信息系统得到更多时间的完善。
目前,语音技术除了在少数领域的有可观的利用率外,在医疗领域上却是不见踪影,不知如何去结合使用。语音技术尚且处于增长阶段,需要各个领域发现并开发相关技术设备去结合该项技术的使用。而在医疗上的前景十分可观,如果能够将语音识别技术纳入使用,将会为医疗信息系统提供相当高效的服务。以下便是对基于语音识别技术的影像科诊断报告生成系统的研究及设计探讨。
二、系统设计和关键技术
1、系统的基本结构。
对该系统的设计主要是以语音识别引擎为主,诊断报告系统为辅作为一个基础建立起来的,作为该系统的核心部分——语音识别引擎,其主要工作是将语音翻译成文字形式表现出来,在此基础上诊断报告就对该文字内容进行一系列的整理打印储存,进而加以编辑修改形成一份份常规的诊断报告,呈现给医师或者病人,
医院的各科各室分类较为复杂,为了将系统适用于各科各室以及其开发环境(词汇信息语言、API使用情况、系统可运行工作量、可扩展性等)的适用度,针对这种情况,我们将科室以逐级细分的方式加以区分,从语言识别系统输入诊断报告开始,由工作人员进入系统操作,根据科室治疗检查部位区分,再细分得出一份完整的诊断报告,这样的结构设计符合了系统最终目标实现的设计。由于每一份报告是根据每个病人的实际情况在变动的,也就是有特殊性,免不了需要工作人员进行人工干预,也就是说在进入系统之后有个登录系统的步骤以便工作人员的操作管理。
对于系统操作控制台则是为了方便各科各室能够全面的覆盖到,让科室的负责人员在登陆后选择所在或者所需要输入查询的科室病人信息,简单来说,就是扩大它的适用范围,而该模块是科室的管理中心。而在进入某一科室后,对具体到所检查的部位,则有另外的分区,比如内脏可以细分为脾脏、肝脏、胰脏等具体检查部位,该检查部位模块在系统中属于关键的部分,且该各模块里的检查部位互相隔开,不会造成不必要的混淆及干扰。依据不同部位的检查还设计不同的词汇等。生活中医院收治的肝检查患者较多,相比其他病源,肝的诊断报告涉及的词汇量也是比较多的。在本设计中,肝检查主要提供数据模板。
2、系统关键技术。
SD是软件开发工具包,该软件开发包主要是为了语音应用程序和语音引擎所制作的。它的功能包括兼容Win32的语音应用程序编程接口、微软连续语音识别、语音合成,除此之外,还能编辑翻译以及调试语音,示例和帮助文档。只要SAPI联合API向应用程序发出连接,语音引擎的高层接口便会接收到指令运行转化,语音识别技术实现用于控制和管理各种语音引擎的低层细节,即开发人员不需了解复杂的语音技术的具体实现,只需使用简单的API来开发应用程序。
SAPI引擎有两种:语音合成(TTS)引擎和语音识别引擎(SR)。TTS原理上人们熟悉的文字字符等转化成声音流通过相应设备发出(如喇叭、音箱)声音。而SR则是将外界声音转化为可读可见的文字字符等。
结束语:
结合SDK技术以及医学信息系统提供的信息技术,以输入方式为主完成大量完整诊断报告的制作,大大减少了医院方面的输入工作量,使医学界向信息化,数字化发展,提高了医院工作效率和整体设备水平。通过人工操作,使人与机器结合工作交流,节省时间实现利益最大化。语音识别技术的运用打破了其运用范围狭隘的观念,更多的人关注语音识别技术的开发运用。尽管现在仍然处于局限的状态,但其本身有很多未知领域有待开发运用,在其日益成熟中将会为医学界带来不可忽视的贡献。
参考文献
[1] 朱学芳,徐建平.计算机语音信号处理与语音识别系统[J].南京邮电学院学报,2015,18(53):117-118.
[2] 朱杰,张申生.基于COM技术的语音应用程序的设计和实现[J].计算机工程,2016,27(5):108-109.
[3] 朱勇,曾学东.语音合成技术在软件开发中的应用[J].黑龙江大学自然科学学报,2014(5):208-209
关键词: 语音识别技术;Microsoft Speech SDK;影像科诊断报告
【中图分类号】 R197.324 【文献标识码】 A【文章编号】 2236-1879(2018)12-0201-01
日常生活中,在就醫的过程中,医生提供的医疗诊断单子都是专业的诊断术语,不同的数据检查结果并不能让我们对疾病有清楚的认知,而是需要医生的讲解。据数据统计,任何一家中大型医院的临床检查科室专业人员书写的诊断报告中,就有60%~70%的书诊断报告布满了"天文字符",一般人即便看不懂也能发现其重复率几乎是一张诊断报告的一半。而构成那些"天文字符"的也只是一些词汇。这样的现象在科技信息的发达今日已经随着医疗设备的更进在慢慢改善,其他行业在信息化、数据化中逐渐呈现出更加快捷高效的状态,医疗领域也不例外。一、语音识别技术发展的必要性调查报告显示,大部分正规设备较为完善的医院,每天的病人流动数量的都在不断的变化,病人的病情也跟着流动,诊断数据也在不断更新,这就意味着负责生成诊断报告的工作人员需要在有限的时间内将患者的各项资料进行数据化处理,并生产诊断报告。
当下计算机技术已经相当成熟,不仅仅只是在科学领域,包括医疗也有自己一套强大的计算机技术使用方法,无论是在公众号预约挂号,还是一个医院的信息系统,都在计算机技术的囊括之下,信息的录入、对图像的整理分析以及传输系统的整合,都是医院在计算机技术下的信息化、数字化的表现趋势,一个医院的等级已经体现在计算机水平的高低上了。但是即便如此,大量的诊断报告输入仍然需要人工去实现完成,也就是说,在计算机技术的基础上需要去开发一个语音识别系统来识别小词汇,继而使重复率高的诊断报告得到改善且快速录入,提高相应的工作效率,减轻工作人员的大量的键盘输入工作量,从而使整个信息系统得到更多时间的完善。
目前,语音技术除了在少数领域的有可观的利用率外,在医疗领域上却是不见踪影,不知如何去结合使用。语音技术尚且处于增长阶段,需要各个领域发现并开发相关技术设备去结合该项技术的使用。而在医疗上的前景十分可观,如果能够将语音识别技术纳入使用,将会为医疗信息系统提供相当高效的服务。以下便是对基于语音识别技术的影像科诊断报告生成系统的研究及设计探讨。
二、系统设计和关键技术
1、系统的基本结构。
对该系统的设计主要是以语音识别引擎为主,诊断报告系统为辅作为一个基础建立起来的,作为该系统的核心部分——语音识别引擎,其主要工作是将语音翻译成文字形式表现出来,在此基础上诊断报告就对该文字内容进行一系列的整理打印储存,进而加以编辑修改形成一份份常规的诊断报告,呈现给医师或者病人,
医院的各科各室分类较为复杂,为了将系统适用于各科各室以及其开发环境(词汇信息语言、API使用情况、系统可运行工作量、可扩展性等)的适用度,针对这种情况,我们将科室以逐级细分的方式加以区分,从语言识别系统输入诊断报告开始,由工作人员进入系统操作,根据科室治疗检查部位区分,再细分得出一份完整的诊断报告,这样的结构设计符合了系统最终目标实现的设计。由于每一份报告是根据每个病人的实际情况在变动的,也就是有特殊性,免不了需要工作人员进行人工干预,也就是说在进入系统之后有个登录系统的步骤以便工作人员的操作管理。
对于系统操作控制台则是为了方便各科各室能够全面的覆盖到,让科室的负责人员在登陆后选择所在或者所需要输入查询的科室病人信息,简单来说,就是扩大它的适用范围,而该模块是科室的管理中心。而在进入某一科室后,对具体到所检查的部位,则有另外的分区,比如内脏可以细分为脾脏、肝脏、胰脏等具体检查部位,该检查部位模块在系统中属于关键的部分,且该各模块里的检查部位互相隔开,不会造成不必要的混淆及干扰。依据不同部位的检查还设计不同的词汇等。生活中医院收治的肝检查患者较多,相比其他病源,肝的诊断报告涉及的词汇量也是比较多的。在本设计中,肝检查主要提供数据模板。
2、系统关键技术。
SD是软件开发工具包,该软件开发包主要是为了语音应用程序和语音引擎所制作的。它的功能包括兼容Win32的语音应用程序编程接口、微软连续语音识别、语音合成,除此之外,还能编辑翻译以及调试语音,示例和帮助文档。只要SAPI联合API向应用程序发出连接,语音引擎的高层接口便会接收到指令运行转化,语音识别技术实现用于控制和管理各种语音引擎的低层细节,即开发人员不需了解复杂的语音技术的具体实现,只需使用简单的API来开发应用程序。
SAPI引擎有两种:语音合成(TTS)引擎和语音识别引擎(SR)。TTS原理上人们熟悉的文字字符等转化成声音流通过相应设备发出(如喇叭、音箱)声音。而SR则是将外界声音转化为可读可见的文字字符等。
结束语:
结合SDK技术以及医学信息系统提供的信息技术,以输入方式为主完成大量完整诊断报告的制作,大大减少了医院方面的输入工作量,使医学界向信息化,数字化发展,提高了医院工作效率和整体设备水平。通过人工操作,使人与机器结合工作交流,节省时间实现利益最大化。语音识别技术的运用打破了其运用范围狭隘的观念,更多的人关注语音识别技术的开发运用。尽管现在仍然处于局限的状态,但其本身有很多未知领域有待开发运用,在其日益成熟中将会为医学界带来不可忽视的贡献。
参考文献
[1] 朱学芳,徐建平.计算机语音信号处理与语音识别系统[J].南京邮电学院学报,2015,18(53):117-118.
[2] 朱杰,张申生.基于COM技术的语音应用程序的设计和实现[J].计算机工程,2016,27(5):108-109.
[3] 朱勇,曾学东.语音合成技术在软件开发中的应用[J].黑龙江大学自然科学学报,2014(5):208-209