一种语义级文本协同图像识别方法

来源 :哈尔滨工业大学学报 | 被引量 : 13次 | 上传用户:kizanliu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决单纯依赖图像低级视觉模态信息进行图像识别准率低的问题.考虑到许多图像中存在文本信息,提出了利用图像中的文本信息辅助图像识别的语义级文本协同图像识别方法.该方法通过文本定位方法定位到图像中的文本块,对其进行分割、二值化、提取特征等处理;然后获取语义,提取图像底层视觉信息,计算两模态的相关性,从而得到协同后验概率;最后,得到联合后验概率,并取其中最大联合后验概率对图像进行识别.在自建体育视频帧数据库中,通过与以朴素贝叶斯为代表的单模态方法进行比较,方法在3种不同视觉特征下均具有更高的准确率.实验结
其他文献
一、土壤选择选择土层深厚,土壤肥沃疏松的壤土或沙壤土。选择地块需地势平坦,有良好的灌水和排水条件。
玉米晋糯205在奇台农场试种两年,面积达1000公顷,取得了较好的经济效益。晋糯205不但优质、高产、稳产,而且适应性广,抗逆性强,商品率高,鲜穗甜粘鲜香,皮薄无渣,口感好,营养品质佳,适应
土坝是由土、砂或石块构成主体部分和不透水材料(如粘土或混凝土)构成坝心的坝。它是一种古老而至今还不断发展并得到广泛使用的挡水建筑物。土坝的优点:筑坝材料取自当地,可节
随着我国改革开放的深入发展以及社会主义市场经济体制的确立,城乡居民收入差距不断拉大,引发社会各界的广泛关注。居民收入差距过大、收入分配不均,不但影响经济的持续增长,
为研究相邻建筑地震碰撞破坏机理,调查了芦山地震中相邻建筑碰撞破坏概况,并应用芦山地震加速度记录计算了相邻建筑地震碰撞反应,分析了防震缝宽度和结构质量对碰撞作用的影