论文部分内容阅读
在机器学习中,间隔常用来度量分类器的置信度。其中支持向量机中的最大间隔算法因具有强壮的理论保证并在实际应用中展现出优异的性能而成为机器学习领域的一个研究热点。双人交互行为是日常生活中最常见的人体行为,因此,研究双人交互行为识别方法具有非常重要的实际意义。本文在最大间隔算法的基础上,提出两种双人交互行为识别的方法。第一种是基于最大间隔条件随机场的双人行为识别方法。传统的条件随机场采用最大似然方法学习模型参数,但该方法推广能力不佳,又不支持核函数,无法用于高维特征空间。针对这一情况,提出一种基于最大间隔方法的条件随机场,具体的优化算法采用块坐标Frank-Wolfe算法,该算法是经典的Frank-Wolfe算法的一种改进,是一种联机算法。该算法不需要选择步长,最优的步长可以以封闭的形式计算得到,有一个对偶间隔保证,可以将对偶间隔作为停止迭代的标准,另外,即使是使用近似的最大推断函数,算法的收敛率依然稳定。采用最大间隔方法学习条件随机场模型参数的方法既保留了条件随机场的结构化优势又利用了最大间隔算法推广能力强的优点。第二种是基于最大间隔马尔可夫网模型的双人交互行为分析。提出一种新型的分层识别方法,采用最大间隔马尔可夫网模型对双人交互行为的高层语义建模,相对于第一种方法的单层识别,该方法将整个双人交互行为识别的过程分为四个层次:第一,采用一种将结构化的局部稀疏模型和可变的模板更新策略相结合的算法对双人数据库进行单人跟踪,分别得到视频中的单个人;第二,对单人分别提取剪影、光流和运动上下文特征,将这三种特征融合得到最终的特征描述符,实验结果表明了这种简单的提取特征的方法是有效的;第三,采用一种新型的度量学习算法-大间隔最近邻(Large Margin Nearest Neighbors)模型识别得到原子行为语义;最后,训练最大间隔马尔可夫网和模板,得到交互行为模型,然后利用该模型对两人的原子行为语义建模,最终得到每个人的交互行为。以上两种方法均在UT数据库上进行实验,实验结果证明了提出的最大间隔算法是有效的。