时序卷积相关论文
在大数据和深度学习发展的推动下,文本图像识别对人们的日常生活产生了重要的影响。本文围绕文本图像识别任务,在基于编码器-解码......
视频行为检测是指在视频中检测出包含行为的时间片段作为时序行为提案。现有工作主要分成两类:一类是利用视频的底层细节来生成行......
唇语识别是一种可以仅根据说话人的唇部运动状态中预测出说话人说话内容的技术,在计算机视觉和自然语言处理的交叉应用中具有极其......
随着互联网技术的发展,图像已经成为人们信息交流的重要媒介。图像中的文本具有精准的语义,准确的识别可以对机器视觉等领域的人工......
序列推荐在构建现代推荐系统中起着十分重要的作用,如何对序列进行建模是当前学术界研究的热点.针对传统推荐算法难以表示用户兴趣......
在当今的信息社会时代,视频数据呈现爆炸增长的趋势。从海量视频中获取有价值的关键信息变得尤为重要。随着深度学习技术的快速发......
手语视频自动翻译是一个广义的序列到序列问题,其难点在于视频中视觉信息的识别不仅要考虑单帧,还要考虑连续帧的时序变化,同时还......
语音增强技术的目的是对带噪语音中的噪声部分进行抑制,同时尽量保留纯净语音部分。近几年,语音增强开始作为监督性学习问题来解决......
人们希望计算机具有像人类一样理解现实世界的能力,而人体运动作为现实世界中最常见的视觉内容之一,是机器视觉研究的经典研究对象......
近年来,环境污染和全球变暖问题越来越严重。人们日益认识到保护环境,节能减排的重要性。随着人们对环境问题越来越重视以及科技的......