【摘 要】
:
针对语音文稿已知的情况,提出了一种简单方法实现了适用于在线语音流的字幕自动生成系统。主要思路是根据文稿分句的情况确定在线语音的句子边界,进而,将相应的句子显示到屏
【机 构】
:
中国科学院声学研究所语言声学与内容理解重点实验室,腾讯公司语音计算组
论文部分内容阅读
针对语音文稿已知的情况,提出了一种简单方法实现了适用于在线语音流的字幕自动生成系统。主要思路是根据文稿分句的情况确定在线语音的句子边界,进而,将相应的句子显示到屏幕上。假设在线语音的句子起点已知,本文建立了具有帧同步的统计假设似然比模型检测在线语音的句子尾点,在HMM框架下对该模型进行求解。实验表明,如果以检测到的句子尾点与真正的句子尾点的时间差作为指标,对于干净语音,99.5%左右的时间差在一秒以内,达到了实际要求。最后,本文利用所提出的针对在线语音流的字幕自动生成算法,实现了一个适用于在线新闻广播加字
其他文献
小波分析被誉为"数字信号显微镜",其在研究图像分割技术中也取得了较大的发展。本文在这一背景下对小波分析图像分割理论进行了简要分析,同时对含噪图像进行了小波变换对的多尺度分解分析,利用MATLAB仿真对某一植物图像进行了小波变换的应用。结果得出小波分析对图像分割优势明显,从近几年的发展形势来看图像处理领域中小波的图像分割应用前景值得期待,这一研究对于图像分割的不断发展会产生一定的应用意义。
在视觉文化时代,人们似乎越来越迷恋电视、电影等媒介所营造出来的图像世界。文学作品也在商业大潮的裹挟下,与影视产业紧密地捆绑在一起。既有格局之变,也深刻影响到人们对
农业是国家发展的根本,在国家提出"三农"政策之后,农业逐渐成为人们关注的对象,农作物不仅受到病虫害的影响,也会受到老鼠的危害,在本文中笔者主要分析了老鼠的生物学与生态特
在我国证券市场逐步走向成熟的过程中,QFII监管在监管模式、股权分置、信息披露、避险工具等方面暴露出种种问题。应当借鉴国际上其他新兴市场实施QFII制度的成功经验,结合我
中国土壤污染形势严峻。由于土壤环境保护相关法律、法规、标准、规范缺失,土壤污染修复存在着污染场地信息不明、缺乏检测标准、修复责任承担不清、修复基金无法保障等问题
<正>作为中国特色社会主义重要物质基础和政治基础,作为共产党执政兴国的重要支柱和依靠力量,国有企业在经济步入新常态、改革不断深化的今天,如何将党建工作成效转化为企业
提出了一种基于双阈值法改进的镜头边界检测算法。该方法的优势在于通过复检有效降低了突变镜头以及淡入淡出渐变镜头的误检率,同时该方法针对包含较多视频帧的镜头给出了一种进行溶解型渐变镜头检测的方法,有效地提高了溶解型渐变镜头的检出率。实验表明与原算法相比其查全率约提高了11%。
在分布式系统中,随着不同标准中间件的不断出现,提供了一种新的计算方式,并实现了组件间的通信。由于Web服务在分布式异构环境中解决了应用程序的整合问题,导致基于互联网的中间
从数学辅助教学系统的需求分析人手,结合Web开发的特点,确立了三层B/S体系结构,并介绍了用XHTML+ MathML+ SVG框架解决XHTML文档中含有文本、数学公式和数学图形以及SVG文档中含有
为了量化分析机载设备传导干扰超标值对于整机电磁兼容性的影响程度,本文重点研究如何利用传导测试超标策略对传导干扰故障的修复。通过联合测试系统、指标量化和权重分配,将