【摘 要】
:
本文在MILES算法的基础上,提出了一种利用视觉关键词辞典为特征空间的多示例学习算法,并在示例判定的过程中结合分割实现了目标检测与提取。该方法采用“Bag of WordS”模型,将图像作为多示例包,表示该图像的若干视觉关键词作为包中示例,并把视觉关键诃辞典作为特征空间,通过对包中示例个数统计将其映射到特征空间中,随后采用1-norm SVM来挑选重要特征同时对图像进行分类;对判定为正的图像进行示
【机 构】
:
中国科学技术大学电子工程与信息科学系,合肥 230027 中国科学院沈阳自动化研究所机器人国家重点
【出 处】
:
2010年全国模式识别学术会议(CCPR2010)
论文部分内容阅读
本文在MILES算法的基础上,提出了一种利用视觉关键词辞典为特征空间的多示例学习算法,并在示例判定的过程中结合分割实现了目标检测与提取。该方法采用“Bag of WordS”模型,将图像作为多示例包,表示该图像的若干视觉关键词作为包中示例,并把视觉关键诃辞典作为特征空间,通过对包中示例个数统计将其映射到特征空间中,随后采用1-norm SVM来挑选重要特征同时对图像进行分类;对判定为正的图像进行示例判定,以判定为正的示例作为相应的目标“种子”点,然后进一步结合图像分割结果,实现目标提取。在Caltech101等标准图像集上的实验结果证明了本文方法的有效性。
其他文献
在十二烷基苯磺酸钠(SDBS)溶液中,以聚乙烯吡咯烷酮(PVP)为保护剂,用水合肼还原硝酸银制备出了纳米片状银粉。通过SDBS的结构分析和纳米银粉的SEM、XRD表征,探索研究了纳米片状银粉的形成机理,结果表明,SDBS中磺酸基与银离子形成的配位结构是形成纳米片状银粉的关键因素,SDBS分子聚集胶束与银络合形成的八元环极易构架无机-有机层状结构,对银形成片状结构的起到模板作用。
本文首次建立了抗癌配合物3-羟基卡铂的高效液相色谱分析方法。色谱条件:Phenomenex ODS柱(4.6 mm×250mm,5 μm);流动相为50 mmol/L醋酸铵,5 mmol/L辛烷磺酸钠的水溶液;流速是0.8 mL/min;T=40℃;检测波长:3-羟基卡铂在230nm;相关物质3-羟基-1,1-环丁二羧酸在220 nm。此方法线性关系良好,相关系数为0.9995,线性范围是:0.5
根据药品稳定性试验的要求,本文采用高效液相色谱法研究铂抗癌药物奥沙利铂在酸、碱、氧化和还原条件下的稳定性。研究结果表明奥沙利铂在0.05mol/L HCl溶液中放置1h含量降解约20%;在0.02 m01/L NaOH溶液中放置4 h含量降解约20%;在0.05%H2O2溶液中溶液中放置0.5 h含量降解约20%;在0.03%NaHSO3溶液中放置0.5 h时含量降解约30%。结果表明在本试验条件
建立高效液相色谱法测定乙酰丙酮铱的方法。其最佳色谱条件为C18反相色谱柱(Kromasi1柱,250mm×4.6mm× 5μm);流动相:V(甲醇):V(水)=65:35;流量为1 mL/min;柱温:40℃;检测波长:260 nm;进样量:10μL。线性范围为0.192~0.288 mg/mL,v=0.9992;加样回收率为99.96%;RSD=1.08%(n=6)。本法简单、灵敏、准确,适合对
社保机构在发放养老保险的过程中,为了防止出现养老金冒领的情况,常常会采用人脸认证系统对人员进行认证。以往的人脸认证方法只是单纯地将测试人脸与数据库里指定身份下的训练样本进行比对,计算两者的相似度,并没有考虑相似度在整个训练样本集上的分布情况。本文将稀疏表征(Sparse Representation)的方法应用到人脸认证系统中来,提出了稀疏表征的相似度准则SRS。结合Randomfaces、Eig
本文提出了一种基于CT序列图像的解剖性数字肝脏的半自动重构方法。首先利用算法分割出肝脏、病灶和脏器内管道系统,然后与医生指定“点”交互式划分血管分支,自动确定血管分支支配区域,最后各管道系统与病灶融合得到解剖数字肝脏模型。将该模型用于临床,与术中实际情况进行了比对,结果表明,该数字肝脏模型清晰、直观地展现了肝脏血管、肿瘤三维空间毗邻关系,所计算的肝段体积与实际误差较小,为实现精确的术前评估提供了重
针对数字图像篡改中最常用的模糊操作,实现了一种基于像素线性相关性检测的盲取证算法。在假设模糊操作增强像素与邻域像素的线性相关性的基础上,采用基于阈值的最短距离聚类法检测像素线性相关性,发现模糊操作痕迹,实现数字篡改图像的盲取证。实验表明,该方法能够有效地检测数字篡改图像的模糊操作痕迹,并能对模糊操作的图像局部进行准确定位。
本文介绍了在整体2D-3D医学图像配准基础上的分段配准过程。首先对CT体积数据进行三线性插值,得到各向分辨率相同的体积数据,手动分割CT体积数据,标定x-ray拍片场景,采用光线跟踪方法对各段体积数据进行数字影像重建。然后在二维空间上,利用整体体积数据的投影图像对各分段投影图像缺失进行补齐,插值。对不同位置和方向的各段重建图像,在灰度归一化和直方图规定化的摹础上用正交投影SLNC函数评价其与对应位
颜色和边缘能够强烈引起人类视觉注意,颜色和边缘的重复模式隐藏着非常丰富的视觉信息,它对图像的视觉感知和理解具有非常重要的作用。本文根据共生矩阵和直方图的优点,提出一种仝新的直方图来描述颜色和边缘方向的重复模式,本文称之为二元组直方图。本文实验采用具有15000张自然图片的Corel图像库进行实验,实验结果表明:本文提出的二元组直方图能够描述颜色、纹理和形状特征以及窄间关系,检索性能明显地高于边缘直
图像盲复原是在模糊过程未知的情况下将模糊图像恢复为原始清晰图像的过程。本文对单幅图像进行盲复原,运用图像的一部分经过特殊选择的梯度,用迭代求解的方式计算原图像和点扩展函数。目前的大部分主流图像盲复原方法都需要构造对强边缘的预测,而本方法省去了这一步骤,仅通过对现有图像梯度区域的选择,就可以快速有效地估计点扩展函数;由于此点扩展函数的估计模型是近似良态的,对正则项的要求不高,本文据此设计出了更快速的