论文部分内容阅读
摘要:在明确体育计算相关概念之后,综述体育计算研究现状。通过两个研究领域的研究工作,提出目前体育计算中需要解决的问题和关键技术,其一是体育比赛技战术分析;其二是技术动作的图像处理。最后,介绍了作者完成的一些研究工作。
关键词:体育计算;体育比赛分析;运动图像处理
中图分类号:G804.49文献标识码:B文章编号:1007-3612(2007)12-1673-04
随着体育运动的影响不断扩大,利用计算机等高科技手段辅助提高运动员的训练和比赛水平已经成为共识。
所谓的“体育计算”[1],就是以体育竞赛和管理为应用对象、研究如何根据应用对象的特点挖掘计算机新技术,以及利用这些先进计算机技术解决应用中遇到的各种技术问题,从而使运动竞技水平和管理水平有明显地提高。因此,“体育计算”不是简单的计算机技术在体育竞技和管理中的应用,作为一个新的研究领域,它还需要对计算机技术本身进行深入的研究,找到适合体育竞技和管理领域的、具有特色的计算机技术和方法。“体育计算”又是一个交叉学科。结合仿真科学、生物力学、管理科学等学科的理论和方法,研究如何用计算机技术解决体育科学中出现的新问题,是本学科的主要内容。因此,“体育计算”的主要研究内容包括:体育比赛计算机辅助分析、计算机运动仿真,计算机体育管理等。所涉及的计算机技术领域包括:数据库技术、计算机仿真技术、多媒体技术、计算机图形图像处理技术等。
1“体育计算”的研究现状与关键技术
以下分两部分综述“体育比赛技战术分析”和“运动图像处理”的研究现状,以及解决问题所需要的关键技术。
1.1体育比赛技战术分析
1.1.1球类比赛计算机分析排球比赛技战术分析方面代表性的研究成果是意大利Data Project公司开发的Data Volleyball系统[2]。该软件可以支持排球比赛临场技战术的采集、统计和评价等排球比赛的技战术分析工作,为排球教练科学指导比赛提供依据。从技术角度,Data Volleyball在排球技战术数据的采集和比赛视频检索的计算机处理方面有新的贡献。在技战术数据采集时,Data Volleyball采用助记符方法对排球比赛中的基本技术动作进行编码,然后把编码组合成每一个比分的技战术数据。技战术数据虽然采用键盘输入,但由于编码设计巧妙,使得采集数据的信息量完全可以支持对球队技战术的分析与评价工作。在视频检索的计算机处理方面,该软件采用视频与编码绑定的方法,从而能够实现对视频的实时检索。虽然该方法强烈地依赖技战术采集数据,并没有实现视频检索的自动化,但从实用角度上部分地解决了基于内容的视频检索问题。
美国CyberSports公司开发的Basketball[3]软件是篮球技战术分析系统的典型代表。与排球比赛的技战术采集与分析方法有所不同,该软件并没有对比赛中的每一个技战术动作进行编码,也没有采用视频绑定技术对视频文件的进行检索,而是把数据采集的重点放在各种篮球专项技术的采集上,从而分析一场比赛的技战术执行情况。篮球专项技术包括“突破”、“中投”、“远投”、“犯规”等直观技术数据,还包括如“投篮点”这样的具有一定内涵的技术数据。上述数据的采集内容为篮球比赛的技战术分析提供了依据。不仅如此,该软件中采用的技战术采集的方法,也给身体接触类体育比赛临场数据采集的计算机处理提供了可以借鉴的方法和技术。就“投篮点”的采集而言,需要计算机提供投篮点的定位与绘制,如何实现计算机的自动处理是一个具有挑战性的问题。目前该软件还只能做到半自动化处理。
上述两个研究方向基本上能够代表球类比赛计算机分析的研究特点,一个是非接触式比赛(排球),另一个是接触式比赛(篮球)。不难看出,技战术的编码与基于视频的技术分析是球类比赛计算机分析的关键技术,而技战术编码又是视频描述的一种表现形式,描述与视频分析在计算机技术方面紧密相关。
就比赛视频描述而言,其关键性主要体现在:
1) 比赛视频描述的内容是技战术分析的基础。在球类比赛的技战术分析中,需要对比赛中的各种技术动作和战术的执行情况进行统计,各种统计方法都需要大量的样本数据。所以分析结果是否准确直接取决于样本数据的信息含量。
2) 视频描述是基于内容视频检索和编辑的关键。技战术分析的常用方法之一是,教练员通过回放比赛的视频来观察运动员的技术动作和技战术的执行情况。而目前只能通过VCR(Vedueo Caste Record简称VCR)控制技术来实现简单的视频检索功能,如快进、快退等。其主要的技术难点是视频文件中没有包含视频的内容信息,从而无法实现基于内容的视频检索和编辑。如果增加足够的内容信息,检索和编辑就不是十分困难的事情。基于内容的视频检索是图像处理领域的前端研究课题,运动图像专家组(Moving Picture Experts Group)提出的MPEG-7[4]标准为该领域研究提供了相关的技术参考。
技战术分析的技术关键性可以从以下几个方面观察。
1) 基于视频的技战术分析可以提高比赛分析的质量。传统的技战术分析方法是利用简单的统计模型分析技战术的执行情况。由于样本数据的缺乏,使得分析的效果不够细致。基于视频的技战术分析结合视频描述技术,使得该分析方法不但可以完成常规的统计任务,而且更重要的一个手段是把统计与视频图像相结合,使得分析工作更加直观。
2) 基于视频的技战术分析可以解决增加分析效果的作用。结合视频描述技术,视频分析可以实现比赛场景的快速定位,从而实现比赛视频的检索。与传统的非线性编辑技术不同,基于描述的视频分析是在不改变视频文件的前提下,对视频图像片段进行连接和定位,所以分析效率将有明显地提高。
3) 基于视频的技战术分析可以实现比赛场景的重组和仿真回放。结合视频描述技术,可以实现对视频文件中不同场景片断重新组合,模拟真实的比赛画面,实现仿真回放。仿真回放技术可以有效地支持对比赛技战术执行情况的评价工作。通过仿真回放可以调整某一个技战术环节的技术动作或技战术意图,从而指导以后的比赛。
1.1.2技巧类项目计算机分析这里的技巧类项目主要指:体操、跳水(游泳)、蹦床和技巧等项目。下面首先分析关键技术,然后综述研究状况。
上述研究的核心问题是如何获取人体运动的形体信息和基于形体信息的运动分析问题。其中,人体三维运动信息的获取和人体运动的计算机分析是关键技术。人体三维运动信息的获取是人体三维运动分析的基础。
人体三维信息获取有多种方法,常见的方法是在被测对象上加标记,如在球体上涂上特殊的标记,在人体上加反光标注点等。由于这种方法需要在被测对象上增加标记,所以该方法基本上不适合实际比赛中的信息获取。因此,人体三维信息的获取的关键是,如何在不增加标记的情况下获取信息,这给该项工作增加了相当大的难度。在三维人体信息获取中,主要包括人体轮廓提取和人体三维运动参数的获取两方面的技术。
人体轮廓(Human Body Silhouette)的提取是指从图像序列中检测出人体所在的区域,并通过二值化将其从背景中分离出来[5]。人体轮廓提取的基本方法分为基于运动检测法和基于人体形状分析法两种。第一种方法假设场景中只有人在运动,因此检测出的运动区域即为人体所在区域;后一种方法充分利用了人体形状的先验知识,使用模式识别及概率推理的手段从图像中检测人体区域。
基于运动检测法又可以分为以下三种方法[5]:
1) 背景减除法(Background Subtraction) ,利用当前图像与背景图像的差分来检测出运动区域。
2) 时间差分法(Temporal Difference),在连续的图像序列中两个或三个相邻帧间采用基于像素的时间差分,得到帧差图像,并且对其进行后处理来提取出图像中的运动区域。
3) 光流法(Optical Flow),采用了运动目标随时间变化的光流特性。
而基于人体形状分析法又可以分成以下两种方法:
1) 模板匹配法(Template Matching) ,将不同姿态的人体形状作为模板,与输入图像特征进行匹配,可以找出与人相似的形状模式。
2) 概率推理法(Probabilistic Reasoning)。利用了人体形状的几何和拓扑约束关系,从图像中寻找满足人体约束的区域或区域集合(regionassembly)。
人体三维运动参数的获取,是指从视频中获取人体的关节点三维坐标或者关节角度等人体姿态信息[4]。基于关节点的人体运动跟踪是人体三维运动参数获取的基础。由于视频的图像噪声的影响以及视频中人体运动的复杂性,使得人体关节点的跟踪异常困难。目前尚没有一个理想的人体关节点跟踪方法。因此,人们常常在人身上使用标注点,但对于复杂的人体运动,仍然需要采用手动标定关节点的方法。
运动项目不同,人体三维运动分析的要求和目标也不同,但采用的分析方法会有一定的共同点。常用的分析方法是视频对象叠加法,该方法是把两组(或多组)被分析的视频对象叠加到一个视频画面中,然后分析其对象形态的差异,从而给出分析结论。如在跳水项目中,可以利用视频叠加的方法,分析运动员的某一个动作与标准动作的偏差。
目前该方向的理论和应用研究已经取得了一些新的进展。中国科学院计算所数字化研究室对三维人体信息的非接触式提取方法进行深入地研究,并把研究成果应用到奥运攻关课题的研究中,取得了令人满意的效果。其主要贡献有两个方面[4]:
1)基于图像与视频的人体运动参数获取技术。主要研究在视频图像中自动提取人体,并对其运动进行分析、描述和行为理解,获取各种人体运动参数。具体研究内容有:
(1) 快速精确的人体轮廓提取。快速精确的人体轮廓提取是个相当重要但又是比较困难的问题。这是由于动态环境中捕捉的图像受到多方面的影响,比如天气的变化、光照条件的变化、背景的混乱干扰、运动目标的影子、物体与环境之间或者物体与物体之间的遮挡、甚至摄像机的运动等,这些都给准确有效的人体轮廓提取带来了困难。我们综合应用全局运动估计技术、肤色检测技术、区域增长和分割技术,目前已经基本解决了这一难题。在人体轮廓提取基础上,我们进一步研究实现了动作全景图合成和不同动作叠加播放。动作全景图对于运动员和教练员分析与把握动作整体完成情况有很大帮助;而不同动作叠加播放是将不同的动作叠加到同一背景下播放,有助于运动员和教练员分析动作的细微差别。
(2) 动作视频的自动同步技术。可以采用基于运动轮廓子序列匹配方法解决这一问题:首先提取出人体轮廓,形成轮廓序列;然后,对于由两个轮廓序列的连续5帧组成的轮廓子序列集,两两计算相似度,取相似度最大的两个子序列所对应的起始帧作为同步点。
2) 人体关节点运动参数的获取。人体关节点运动参数的获取有助于对动作完成情况进行精确分析。以前实现方法完全靠手工画点实现,工作量非常大,容易出现误差。目前实现了半自动的参数提取方法:手工初始化,计算机自动运动参数提取过程中给予必要的干预。其中自动运动参数提取采用基于人体模型的跟踪方法:使用2D的链杆模型描述人体结构,用匀加速运动模型进行系统状态的预测,综合边缘和灰度信息计算相似度,使用局部优化和全局搜索相结合的多假设跟踪方法。
3) 兴趣事件自动检测技术。以跳水运动为例,基于模式识别的基本原理和技术,给出了跳水视频自动事件检测技术。应用该技术可以在长时间的跳水视频中自动检测出跳水动作片断。
4) 对于任意视频的摄像机定标。摄像机定标是计算机视觉领域中从二维图像提取出三维信息的必不可少的步骤。广义上摄像机定标方法分为两种:传统的标定方法和自定标方法。前者需要使用精密加工的标定参照物。它具有精度高的优点,但操作繁琐。20 世纪90 年代初,Faugeras和Luong 等提出自定标的概念,使得在摄像机任意运动情况下的定标成为可能。但该方法受场景的影响较大,而且精度难以保证。在基于视频的人体运动信息获取中,人们为了保证精度,一般都采用了基于标定参照物的方法。这极大的限制了视频的来源和采集。所以,现有方法都只能对特定采集的视频进行处理,不能处理任意给定的视频。这极大地限制了基于视频人体运动捕获的应用领域。如果对摄像机投影模型进行简化,例如采用仿射投影模型,则可以大大减少摄像机定标的难度,但简化的投影模型不能保证获取结果物理意义上的真实性。
2“体育计算"研究进展和发展趋势
2.1球类比赛临场技战术采集与分析技术第2.1.1节中曾简单介绍过球类比赛计算机分析技术的研究现状,并提出该方向需要深入解决的问题,本节以乒乓球技战术计算机分析为例,介绍作者在2005年一些研究工作。
2.1.1乒乓球比赛技战术描述与采集描述与采集是紧密相连的两个技术问题,以乒乓球比赛为例,该项研究需要解决的实际问题有:
1) 技战术数据采集方式问题。乒乓球比赛中每一个比分的形成要在几分钟,甚至几秒钟内形成,要想手工记录双方运动员的每一个技术细节,其难度主要表现在:
(1) 记录员的记录速度很难跟踪比赛的节奏。经对各种技术类型运动员进行统计,如果只统计发球、接发球和得分三个动作的情况下,一分球中运动员可能采用的动作组合数会达到27万种之多。记录员在如此多选择中,在几秒钟内确定所要记录的动作谈何容易。
(2) 记录员完成比赛的全部记录工作十分疲劳。记录员在进行现场记录时需要不断在比赛现场和记录本(或电脑)之间切换眼球,长此以往记录员很难保持记录的速度和记录的准确性。
2) 技战术数据描述问题。技战术描述是基础,技战术分析直接依赖采集数据“粒度”和数据的表现形式。
(1) 技战术数据的“粒度”是指技战术的细致程度,如果“粒度”过大,统计结果的意义不大;如果统计过细,又会增加了数据采集的难度。所以技战术数据“粒度”十分不好确定。
(2) 技战术数据描述形式是数据分析的基础,自然语言的演绎功能差,不利于计算和量化分析;而符号语言容易进行量化处理,但不容易掌握,给数据采集带来困难。
针对以上提出的问题,本文作者提出了一种适合乒乓球技战术描述和采集的脚本描述语言,该语言首先把乒乓球比赛中运动员的技术动作分解成击球方式、击球基本动作、击球效果、击球路线四个方面,并对其进行编码,这些编码构成乒乓球技战术描述语言的基本词汇。如“正手发下旋1区到6区”的动作编码为“ZX16”。同样也可以对常见技战术进行分类和编码,这些技战术编码构成了脚本描述语言的基本句型,如“发反短攻得分”的编码为F6G1。在技战术编码中,采用了信息压缩的方法,从而有效地削减了编码的长度,使得技战术采集更加快速。
在实际比赛中,可以分别利用脚本描述语言的单词与句型编码进行技战术信息的采集。下面以后者为例,介绍技战术采集的过程。
基于技战术编码的数据采集技术是指,利用技战术编码规则,对比赛中双方运动实际运用的技战术,选择一方所运用的技战术加以描述并输入到计算机中。以上一节给出的案例为例,具体输入码如下:
从图2中可以看出,基于技战术的采集技术比较简单,适合比赛临场技战术的采集工作。
2.1.2乒乓球比赛技战术分析乒乓球技战术描述与采集的最终目的是数据分析,从而发现比赛中潜在的规律,指导运动员的训练和比赛。数据挖掘技术是一种有效地数据分析技术,它利用计算机收集、存储数据,并通过数据库(数据仓库)对数据进行分类,在此基础上利用各种数据挖掘算法发现潜在的规律。数据挖掘技术在银行、保险等领域有广泛地应用,但在体育比赛的分析中,尤其是在乒乓球比赛的技战术分析中还很少采用。下面介绍本文作者2005年在该方面的一些工作。
在乒乓球比赛中,技战术的制定与对手采用的战术有关,即战术中一个技术动作的执行仅与对方采用的技战术动作有关,从而表现出马尔科夫过程的特性。
我们对基于马尔科夫过程的数据挖掘方法进行了研究和讨论,其主要贡献如下:1) 从理论上证明了基于马尔科夫过程的系统关键因素挖掘方法的正确性,给出了系统可靠性灵敏度分析中转移概率增量的设定方法,为进一步挖掘关键因素奠定了基础。2) 提出了基于马尔科夫过程的数据挖掘算法,并对算法的执行时间和空间进行了分析。3) 结合乒乓球比赛中制胜因素分析问题,给出了挖掘算法的应用。经过分析得出“高水平乒乓球比赛中,控制到相持、发球到接发球和控制到进攻”是比赛制胜关键的结论,这一结论与实际情况吻合。
提出的数据挖掘方法不但可以用于乒乓球比赛的技战术分析,还可以用于其他球类比赛的技战术分析,比如排球、羽毛球、网球等等,只要系统行为满足马尔科夫过程条件既可。体育比赛技战术分析中应用数据挖掘技术还是一种新的尝试,我们已经开发出乒乓球比赛临场技战术分析系统。
2.2运动对象检测前面的2.2节中已经介绍了运动对象检测的关键技术和研究现状,从技术角度,其检测技术和手段进展不是十分明显,但从应用角度,其成果分布逐渐扩大,应用效果也越来越明显。下面简单介绍一下乒乓球运行速度、旋转和与球板碰撞检测等方面的研究成果。
速度、旋转是乒乓球两个最基本的运动状态,亦是乒乓球运动的重要制胜因素,1984年5月,国家体科所与电子工业部12所共同研制成功的“pd-l型乒乓球动态测转仪”具有划时代的意义[6]。但因受到检测仪器性能特点的限制,测试对象必须到放置该仪器的房间内进行测试,所以无法检测运动员在实际比赛中击球的旋转和速度。目前国内外乒乓球器材厂家对所生产的器材检测方法和技术不尽相同,没有形成标准,国际乒联也没有颁布相应的技术标准和解决方案[7]。所以,乒乓球行为检测研究具有现实意义。
由于普通的25帧视频图像无法记录实战中乒乓球飞行速度、旋转的全过程,所以该项研究的主要内容和关键技术为:
1) 基于高速摄像的采集技术研究。要提高采集精度,高速摄像是首选技术,这里包括如何根据乒乓球的品牌、颜色和光照度设置图像的分辨率。
2) 数字图像的传输技术研究。对高速摄像机拍摄的视频图像需要传输到计算机内保存,由于高速摄像机拍摄图像的容量非常大,每秒种可以达到1000帧以上,所以如何选择、传输样本图像需要精心地设计,否则将直接影响检测的实效性。
3) 基于数字图像的乒乓球旋转和速度检测算法研究。乒乓球检测是一种小目标检测问题,其检测方法和检测效果有较大的挑战性。研究中在一些常规的检测方法中找到适合本课题研究的方法和技术。研究中检测算法的效能(处理速度、检测效果)是研究重点。
针对上述研究问题,我们采用了如下解决方案。
4) 高速摄像的采集技术研究。采用CPL MS系列高速摄像设备,以天津729乒乓球器材厂生产的器材为检测对象,在北京体育大学等单位进行实地拍摄,拍摄中测定了采集方案的可行性,从检测技术角度给出图像采集的各项参数区间,同时也为后续的检测工作收集素材。
5) 数字图像的传输技术研究。采用CPL MS系列高速摄像设备的配套软件,对数字图像的传输技术研究。分析图像传输和存储的时间和容量需求,包括不同格式图像的时空指标;比照乒乓球比赛中一次对决中的实际发生平均时间,确定传输的最大延迟和检测时间最佳区间;根据上述实际测定的指标,开发(或二次开发)达到最佳传输和存储区间的软件系统。
6) 基于数字图像的乒乓球旋转和速度检测算法研究。首先确定背景图片,然后利用静态检测法检测出球台和球体,再把球体作为背景检测球体上的标牌,通过分析标牌的位移变化计算乒乓球的旋转强度;速度检测的技术路线为:首先确定背景图片,然后检测出球网的网带作为参照物,再利用静态方法检测出球体,通过比较系列图片中球体与参照物的变化情况计算球的速度。
采用上述研究方案得到检测结果的技术指标如下:
1) 能够对高水平乒乓球比赛中典型的技术动作,如弧圈球、发球等,所产生的球体运行速度和旋转强度进行检测,并给出强度值。检测精度误差控制在±0.1,检测成功率控制在90%以上。
2) 能够实现实时检测,在图像拍摄速度与传输速度一定的情况,检测时间控制在1分钟之内,做到基本上与实际比赛中一次对决的时间相匹配。
3) 能够实现各种品牌的乒乓球进行检测,包括不同颜色乒乓球的检测;对比赛场地没有明显限制,符合国际乒联标准的场地和器材都可以进行检测。
国内目前还没有同类产品见报,所以本课题的研究成果一经研究成功即可申报新型发明专利,同时也可以申报行业技术标准核规范。本课题研究成果可以在国、内外各级运动队使用,也可以在国内外体育院校乒乓球专业的教学与科研中使用。
3总结
以上分两个专题,综述了体育计算的研究现状、需要解决的实际问题以及解决这些问题的方法和思路;又介绍了作者本人在2005年的部分研究工作。为进一步开展该领域的研究提供了参考性建议。“体育计算”一词在本文中首次提出,是笔者的个人意见,但作为一个迅速发展的计算机应用研究领域,强调其研究领域的特殊性有其必要求。2008年奥运会将在北京召开,深入开展该领域的研究有一定的现实意义。
体育计算涉及到体育科研的方方面面。由于篇幅有限,本文仅介绍了小部分研究工作和成果,更多的课题等待有识之士去研究与挖掘。相信在不久的将来,体育计算的研究成果将会被更多一线教练员采用,进一步提高体育竞技水平整体水平。
参考文献:
[1] 赵会群,等.体育计算:一个新的计算机应用研究领域[J].计算机科学,2004,31(8):89-92.
[2] DataProject[EB/OL]. http://www.dataproject.com.
[3] DVCoach[EB/OL]. http://www.prowess.com.au.
[4] 钟玉琢,等.基于对象的多媒体数据压缩编码国际标准—MPEG-4及其校验模型[M].北京:科学出版社,2000.
[5] 王兆琪,等.面向体育训练的三维人体仿真与视频分析,http:://www.baidu.com.
[6] 吴焕群,等.乒乓球旋转的实验研究 乒乓长盛的训练学探索[M].北京:北京体育大学出版社,2002,12:128-14.
[7] J.Rufford Harrison. Recent Problems with Equipment,ITTF'04.http://www.ittf.com.
关键词:体育计算;体育比赛分析;运动图像处理
中图分类号:G804.49文献标识码:B文章编号:1007-3612(2007)12-1673-04
随着体育运动的影响不断扩大,利用计算机等高科技手段辅助提高运动员的训练和比赛水平已经成为共识。
所谓的“体育计算”[1],就是以体育竞赛和管理为应用对象、研究如何根据应用对象的特点挖掘计算机新技术,以及利用这些先进计算机技术解决应用中遇到的各种技术问题,从而使运动竞技水平和管理水平有明显地提高。因此,“体育计算”不是简单的计算机技术在体育竞技和管理中的应用,作为一个新的研究领域,它还需要对计算机技术本身进行深入的研究,找到适合体育竞技和管理领域的、具有特色的计算机技术和方法。“体育计算”又是一个交叉学科。结合仿真科学、生物力学、管理科学等学科的理论和方法,研究如何用计算机技术解决体育科学中出现的新问题,是本学科的主要内容。因此,“体育计算”的主要研究内容包括:体育比赛计算机辅助分析、计算机运动仿真,计算机体育管理等。所涉及的计算机技术领域包括:数据库技术、计算机仿真技术、多媒体技术、计算机图形图像处理技术等。
1“体育计算”的研究现状与关键技术
以下分两部分综述“体育比赛技战术分析”和“运动图像处理”的研究现状,以及解决问题所需要的关键技术。
1.1体育比赛技战术分析
1.1.1球类比赛计算机分析排球比赛技战术分析方面代表性的研究成果是意大利Data Project公司开发的Data Volleyball系统[2]。该软件可以支持排球比赛临场技战术的采集、统计和评价等排球比赛的技战术分析工作,为排球教练科学指导比赛提供依据。从技术角度,Data Volleyball在排球技战术数据的采集和比赛视频检索的计算机处理方面有新的贡献。在技战术数据采集时,Data Volleyball采用助记符方法对排球比赛中的基本技术动作进行编码,然后把编码组合成每一个比分的技战术数据。技战术数据虽然采用键盘输入,但由于编码设计巧妙,使得采集数据的信息量完全可以支持对球队技战术的分析与评价工作。在视频检索的计算机处理方面,该软件采用视频与编码绑定的方法,从而能够实现对视频的实时检索。虽然该方法强烈地依赖技战术采集数据,并没有实现视频检索的自动化,但从实用角度上部分地解决了基于内容的视频检索问题。
美国CyberSports公司开发的Basketball[3]软件是篮球技战术分析系统的典型代表。与排球比赛的技战术采集与分析方法有所不同,该软件并没有对比赛中的每一个技战术动作进行编码,也没有采用视频绑定技术对视频文件的进行检索,而是把数据采集的重点放在各种篮球专项技术的采集上,从而分析一场比赛的技战术执行情况。篮球专项技术包括“突破”、“中投”、“远投”、“犯规”等直观技术数据,还包括如“投篮点”这样的具有一定内涵的技术数据。上述数据的采集内容为篮球比赛的技战术分析提供了依据。不仅如此,该软件中采用的技战术采集的方法,也给身体接触类体育比赛临场数据采集的计算机处理提供了可以借鉴的方法和技术。就“投篮点”的采集而言,需要计算机提供投篮点的定位与绘制,如何实现计算机的自动处理是一个具有挑战性的问题。目前该软件还只能做到半自动化处理。
上述两个研究方向基本上能够代表球类比赛计算机分析的研究特点,一个是非接触式比赛(排球),另一个是接触式比赛(篮球)。不难看出,技战术的编码与基于视频的技术分析是球类比赛计算机分析的关键技术,而技战术编码又是视频描述的一种表现形式,描述与视频分析在计算机技术方面紧密相关。
就比赛视频描述而言,其关键性主要体现在:
1) 比赛视频描述的内容是技战术分析的基础。在球类比赛的技战术分析中,需要对比赛中的各种技术动作和战术的执行情况进行统计,各种统计方法都需要大量的样本数据。所以分析结果是否准确直接取决于样本数据的信息含量。
2) 视频描述是基于内容视频检索和编辑的关键。技战术分析的常用方法之一是,教练员通过回放比赛的视频来观察运动员的技术动作和技战术的执行情况。而目前只能通过VCR(Vedueo Caste Record简称VCR)控制技术来实现简单的视频检索功能,如快进、快退等。其主要的技术难点是视频文件中没有包含视频的内容信息,从而无法实现基于内容的视频检索和编辑。如果增加足够的内容信息,检索和编辑就不是十分困难的事情。基于内容的视频检索是图像处理领域的前端研究课题,运动图像专家组(Moving Picture Experts Group)提出的MPEG-7[4]标准为该领域研究提供了相关的技术参考。
技战术分析的技术关键性可以从以下几个方面观察。
1) 基于视频的技战术分析可以提高比赛分析的质量。传统的技战术分析方法是利用简单的统计模型分析技战术的执行情况。由于样本数据的缺乏,使得分析的效果不够细致。基于视频的技战术分析结合视频描述技术,使得该分析方法不但可以完成常规的统计任务,而且更重要的一个手段是把统计与视频图像相结合,使得分析工作更加直观。
2) 基于视频的技战术分析可以解决增加分析效果的作用。结合视频描述技术,视频分析可以实现比赛场景的快速定位,从而实现比赛视频的检索。与传统的非线性编辑技术不同,基于描述的视频分析是在不改变视频文件的前提下,对视频图像片段进行连接和定位,所以分析效率将有明显地提高。
3) 基于视频的技战术分析可以实现比赛场景的重组和仿真回放。结合视频描述技术,可以实现对视频文件中不同场景片断重新组合,模拟真实的比赛画面,实现仿真回放。仿真回放技术可以有效地支持对比赛技战术执行情况的评价工作。通过仿真回放可以调整某一个技战术环节的技术动作或技战术意图,从而指导以后的比赛。
1.1.2技巧类项目计算机分析这里的技巧类项目主要指:体操、跳水(游泳)、蹦床和技巧等项目。下面首先分析关键技术,然后综述研究状况。
上述研究的核心问题是如何获取人体运动的形体信息和基于形体信息的运动分析问题。其中,人体三维运动信息的获取和人体运动的计算机分析是关键技术。人体三维运动信息的获取是人体三维运动分析的基础。
人体三维信息获取有多种方法,常见的方法是在被测对象上加标记,如在球体上涂上特殊的标记,在人体上加反光标注点等。由于这种方法需要在被测对象上增加标记,所以该方法基本上不适合实际比赛中的信息获取。因此,人体三维信息的获取的关键是,如何在不增加标记的情况下获取信息,这给该项工作增加了相当大的难度。在三维人体信息获取中,主要包括人体轮廓提取和人体三维运动参数的获取两方面的技术。
人体轮廓(Human Body Silhouette)的提取是指从图像序列中检测出人体所在的区域,并通过二值化将其从背景中分离出来[5]。人体轮廓提取的基本方法分为基于运动检测法和基于人体形状分析法两种。第一种方法假设场景中只有人在运动,因此检测出的运动区域即为人体所在区域;后一种方法充分利用了人体形状的先验知识,使用模式识别及概率推理的手段从图像中检测人体区域。
基于运动检测法又可以分为以下三种方法[5]:
1) 背景减除法(Background Subtraction) ,利用当前图像与背景图像的差分来检测出运动区域。
2) 时间差分法(Temporal Difference),在连续的图像序列中两个或三个相邻帧间采用基于像素的时间差分,得到帧差图像,并且对其进行后处理来提取出图像中的运动区域。
3) 光流法(Optical Flow),采用了运动目标随时间变化的光流特性。
而基于人体形状分析法又可以分成以下两种方法:
1) 模板匹配法(Template Matching) ,将不同姿态的人体形状作为模板,与输入图像特征进行匹配,可以找出与人相似的形状模式。
2) 概率推理法(Probabilistic Reasoning)。利用了人体形状的几何和拓扑约束关系,从图像中寻找满足人体约束的区域或区域集合(regionassembly)。
人体三维运动参数的获取,是指从视频中获取人体的关节点三维坐标或者关节角度等人体姿态信息[4]。基于关节点的人体运动跟踪是人体三维运动参数获取的基础。由于视频的图像噪声的影响以及视频中人体运动的复杂性,使得人体关节点的跟踪异常困难。目前尚没有一个理想的人体关节点跟踪方法。因此,人们常常在人身上使用标注点,但对于复杂的人体运动,仍然需要采用手动标定关节点的方法。
运动项目不同,人体三维运动分析的要求和目标也不同,但采用的分析方法会有一定的共同点。常用的分析方法是视频对象叠加法,该方法是把两组(或多组)被分析的视频对象叠加到一个视频画面中,然后分析其对象形态的差异,从而给出分析结论。如在跳水项目中,可以利用视频叠加的方法,分析运动员的某一个动作与标准动作的偏差。
目前该方向的理论和应用研究已经取得了一些新的进展。中国科学院计算所数字化研究室对三维人体信息的非接触式提取方法进行深入地研究,并把研究成果应用到奥运攻关课题的研究中,取得了令人满意的效果。其主要贡献有两个方面[4]:
1)基于图像与视频的人体运动参数获取技术。主要研究在视频图像中自动提取人体,并对其运动进行分析、描述和行为理解,获取各种人体运动参数。具体研究内容有:
(1) 快速精确的人体轮廓提取。快速精确的人体轮廓提取是个相当重要但又是比较困难的问题。这是由于动态环境中捕捉的图像受到多方面的影响,比如天气的变化、光照条件的变化、背景的混乱干扰、运动目标的影子、物体与环境之间或者物体与物体之间的遮挡、甚至摄像机的运动等,这些都给准确有效的人体轮廓提取带来了困难。我们综合应用全局运动估计技术、肤色检测技术、区域增长和分割技术,目前已经基本解决了这一难题。在人体轮廓提取基础上,我们进一步研究实现了动作全景图合成和不同动作叠加播放。动作全景图对于运动员和教练员分析与把握动作整体完成情况有很大帮助;而不同动作叠加播放是将不同的动作叠加到同一背景下播放,有助于运动员和教练员分析动作的细微差别。
(2) 动作视频的自动同步技术。可以采用基于运动轮廓子序列匹配方法解决这一问题:首先提取出人体轮廓,形成轮廓序列;然后,对于由两个轮廓序列的连续5帧组成的轮廓子序列集,两两计算相似度,取相似度最大的两个子序列所对应的起始帧作为同步点。
2) 人体关节点运动参数的获取。人体关节点运动参数的获取有助于对动作完成情况进行精确分析。以前实现方法完全靠手工画点实现,工作量非常大,容易出现误差。目前实现了半自动的参数提取方法:手工初始化,计算机自动运动参数提取过程中给予必要的干预。其中自动运动参数提取采用基于人体模型的跟踪方法:使用2D的链杆模型描述人体结构,用匀加速运动模型进行系统状态的预测,综合边缘和灰度信息计算相似度,使用局部优化和全局搜索相结合的多假设跟踪方法。
3) 兴趣事件自动检测技术。以跳水运动为例,基于模式识别的基本原理和技术,给出了跳水视频自动事件检测技术。应用该技术可以在长时间的跳水视频中自动检测出跳水动作片断。
4) 对于任意视频的摄像机定标。摄像机定标是计算机视觉领域中从二维图像提取出三维信息的必不可少的步骤。广义上摄像机定标方法分为两种:传统的标定方法和自定标方法。前者需要使用精密加工的标定参照物。它具有精度高的优点,但操作繁琐。20 世纪90 年代初,Faugeras和Luong 等提出自定标的概念,使得在摄像机任意运动情况下的定标成为可能。但该方法受场景的影响较大,而且精度难以保证。在基于视频的人体运动信息获取中,人们为了保证精度,一般都采用了基于标定参照物的方法。这极大的限制了视频的来源和采集。所以,现有方法都只能对特定采集的视频进行处理,不能处理任意给定的视频。这极大地限制了基于视频人体运动捕获的应用领域。如果对摄像机投影模型进行简化,例如采用仿射投影模型,则可以大大减少摄像机定标的难度,但简化的投影模型不能保证获取结果物理意义上的真实性。
2“体育计算"研究进展和发展趋势
2.1球类比赛临场技战术采集与分析技术第2.1.1节中曾简单介绍过球类比赛计算机分析技术的研究现状,并提出该方向需要深入解决的问题,本节以乒乓球技战术计算机分析为例,介绍作者在2005年一些研究工作。
2.1.1乒乓球比赛技战术描述与采集描述与采集是紧密相连的两个技术问题,以乒乓球比赛为例,该项研究需要解决的实际问题有:
1) 技战术数据采集方式问题。乒乓球比赛中每一个比分的形成要在几分钟,甚至几秒钟内形成,要想手工记录双方运动员的每一个技术细节,其难度主要表现在:
(1) 记录员的记录速度很难跟踪比赛的节奏。经对各种技术类型运动员进行统计,如果只统计发球、接发球和得分三个动作的情况下,一分球中运动员可能采用的动作组合数会达到27万种之多。记录员在如此多选择中,在几秒钟内确定所要记录的动作谈何容易。
(2) 记录员完成比赛的全部记录工作十分疲劳。记录员在进行现场记录时需要不断在比赛现场和记录本(或电脑)之间切换眼球,长此以往记录员很难保持记录的速度和记录的准确性。
2) 技战术数据描述问题。技战术描述是基础,技战术分析直接依赖采集数据“粒度”和数据的表现形式。
(1) 技战术数据的“粒度”是指技战术的细致程度,如果“粒度”过大,统计结果的意义不大;如果统计过细,又会增加了数据采集的难度。所以技战术数据“粒度”十分不好确定。
(2) 技战术数据描述形式是数据分析的基础,自然语言的演绎功能差,不利于计算和量化分析;而符号语言容易进行量化处理,但不容易掌握,给数据采集带来困难。
针对以上提出的问题,本文作者提出了一种适合乒乓球技战术描述和采集的脚本描述语言,该语言首先把乒乓球比赛中运动员的技术动作分解成击球方式、击球基本动作、击球效果、击球路线四个方面,并对其进行编码,这些编码构成乒乓球技战术描述语言的基本词汇。如“正手发下旋1区到6区”的动作编码为“ZX16”。同样也可以对常见技战术进行分类和编码,这些技战术编码构成了脚本描述语言的基本句型,如“发反短攻得分”的编码为F6G1。在技战术编码中,采用了信息压缩的方法,从而有效地削减了编码的长度,使得技战术采集更加快速。
在实际比赛中,可以分别利用脚本描述语言的单词与句型编码进行技战术信息的采集。下面以后者为例,介绍技战术采集的过程。
基于技战术编码的数据采集技术是指,利用技战术编码规则,对比赛中双方运动实际运用的技战术,选择一方所运用的技战术加以描述并输入到计算机中。以上一节给出的案例为例,具体输入码如下:
从图2中可以看出,基于技战术的采集技术比较简单,适合比赛临场技战术的采集工作。
2.1.2乒乓球比赛技战术分析乒乓球技战术描述与采集的最终目的是数据分析,从而发现比赛中潜在的规律,指导运动员的训练和比赛。数据挖掘技术是一种有效地数据分析技术,它利用计算机收集、存储数据,并通过数据库(数据仓库)对数据进行分类,在此基础上利用各种数据挖掘算法发现潜在的规律。数据挖掘技术在银行、保险等领域有广泛地应用,但在体育比赛的分析中,尤其是在乒乓球比赛的技战术分析中还很少采用。下面介绍本文作者2005年在该方面的一些工作。
在乒乓球比赛中,技战术的制定与对手采用的战术有关,即战术中一个技术动作的执行仅与对方采用的技战术动作有关,从而表现出马尔科夫过程的特性。
我们对基于马尔科夫过程的数据挖掘方法进行了研究和讨论,其主要贡献如下:1) 从理论上证明了基于马尔科夫过程的系统关键因素挖掘方法的正确性,给出了系统可靠性灵敏度分析中转移概率增量的设定方法,为进一步挖掘关键因素奠定了基础。2) 提出了基于马尔科夫过程的数据挖掘算法,并对算法的执行时间和空间进行了分析。3) 结合乒乓球比赛中制胜因素分析问题,给出了挖掘算法的应用。经过分析得出“高水平乒乓球比赛中,控制到相持、发球到接发球和控制到进攻”是比赛制胜关键的结论,这一结论与实际情况吻合。
提出的数据挖掘方法不但可以用于乒乓球比赛的技战术分析,还可以用于其他球类比赛的技战术分析,比如排球、羽毛球、网球等等,只要系统行为满足马尔科夫过程条件既可。体育比赛技战术分析中应用数据挖掘技术还是一种新的尝试,我们已经开发出乒乓球比赛临场技战术分析系统。
2.2运动对象检测前面的2.2节中已经介绍了运动对象检测的关键技术和研究现状,从技术角度,其检测技术和手段进展不是十分明显,但从应用角度,其成果分布逐渐扩大,应用效果也越来越明显。下面简单介绍一下乒乓球运行速度、旋转和与球板碰撞检测等方面的研究成果。
速度、旋转是乒乓球两个最基本的运动状态,亦是乒乓球运动的重要制胜因素,1984年5月,国家体科所与电子工业部12所共同研制成功的“pd-l型乒乓球动态测转仪”具有划时代的意义[6]。但因受到检测仪器性能特点的限制,测试对象必须到放置该仪器的房间内进行测试,所以无法检测运动员在实际比赛中击球的旋转和速度。目前国内外乒乓球器材厂家对所生产的器材检测方法和技术不尽相同,没有形成标准,国际乒联也没有颁布相应的技术标准和解决方案[7]。所以,乒乓球行为检测研究具有现实意义。
由于普通的25帧视频图像无法记录实战中乒乓球飞行速度、旋转的全过程,所以该项研究的主要内容和关键技术为:
1) 基于高速摄像的采集技术研究。要提高采集精度,高速摄像是首选技术,这里包括如何根据乒乓球的品牌、颜色和光照度设置图像的分辨率。
2) 数字图像的传输技术研究。对高速摄像机拍摄的视频图像需要传输到计算机内保存,由于高速摄像机拍摄图像的容量非常大,每秒种可以达到1000帧以上,所以如何选择、传输样本图像需要精心地设计,否则将直接影响检测的实效性。
3) 基于数字图像的乒乓球旋转和速度检测算法研究。乒乓球检测是一种小目标检测问题,其检测方法和检测效果有较大的挑战性。研究中在一些常规的检测方法中找到适合本课题研究的方法和技术。研究中检测算法的效能(处理速度、检测效果)是研究重点。
针对上述研究问题,我们采用了如下解决方案。
4) 高速摄像的采集技术研究。采用CPL MS系列高速摄像设备,以天津729乒乓球器材厂生产的器材为检测对象,在北京体育大学等单位进行实地拍摄,拍摄中测定了采集方案的可行性,从检测技术角度给出图像采集的各项参数区间,同时也为后续的检测工作收集素材。
5) 数字图像的传输技术研究。采用CPL MS系列高速摄像设备的配套软件,对数字图像的传输技术研究。分析图像传输和存储的时间和容量需求,包括不同格式图像的时空指标;比照乒乓球比赛中一次对决中的实际发生平均时间,确定传输的最大延迟和检测时间最佳区间;根据上述实际测定的指标,开发(或二次开发)达到最佳传输和存储区间的软件系统。
6) 基于数字图像的乒乓球旋转和速度检测算法研究。首先确定背景图片,然后利用静态检测法检测出球台和球体,再把球体作为背景检测球体上的标牌,通过分析标牌的位移变化计算乒乓球的旋转强度;速度检测的技术路线为:首先确定背景图片,然后检测出球网的网带作为参照物,再利用静态方法检测出球体,通过比较系列图片中球体与参照物的变化情况计算球的速度。
采用上述研究方案得到检测结果的技术指标如下:
1) 能够对高水平乒乓球比赛中典型的技术动作,如弧圈球、发球等,所产生的球体运行速度和旋转强度进行检测,并给出强度值。检测精度误差控制在±0.1,检测成功率控制在90%以上。
2) 能够实现实时检测,在图像拍摄速度与传输速度一定的情况,检测时间控制在1分钟之内,做到基本上与实际比赛中一次对决的时间相匹配。
3) 能够实现各种品牌的乒乓球进行检测,包括不同颜色乒乓球的检测;对比赛场地没有明显限制,符合国际乒联标准的场地和器材都可以进行检测。
国内目前还没有同类产品见报,所以本课题的研究成果一经研究成功即可申报新型发明专利,同时也可以申报行业技术标准核规范。本课题研究成果可以在国、内外各级运动队使用,也可以在国内外体育院校乒乓球专业的教学与科研中使用。
3总结
以上分两个专题,综述了体育计算的研究现状、需要解决的实际问题以及解决这些问题的方法和思路;又介绍了作者本人在2005年的部分研究工作。为进一步开展该领域的研究提供了参考性建议。“体育计算”一词在本文中首次提出,是笔者的个人意见,但作为一个迅速发展的计算机应用研究领域,强调其研究领域的特殊性有其必要求。2008年奥运会将在北京召开,深入开展该领域的研究有一定的现实意义。
体育计算涉及到体育科研的方方面面。由于篇幅有限,本文仅介绍了小部分研究工作和成果,更多的课题等待有识之士去研究与挖掘。相信在不久的将来,体育计算的研究成果将会被更多一线教练员采用,进一步提高体育竞技水平整体水平。
参考文献:
[1] 赵会群,等.体育计算:一个新的计算机应用研究领域[J].计算机科学,2004,31(8):89-92.
[2] DataProject[EB/OL]. http://www.dataproject.com.
[3] DVCoach[EB/OL]. http://www.prowess.com.au.
[4] 钟玉琢,等.基于对象的多媒体数据压缩编码国际标准—MPEG-4及其校验模型[M].北京:科学出版社,2000.
[5] 王兆琪,等.面向体育训练的三维人体仿真与视频分析,http:://www.baidu.com.
[6] 吴焕群,等.乒乓球旋转的实验研究 乒乓长盛的训练学探索[M].北京:北京体育大学出版社,2002,12:128-14.
[7] J.Rufford Harrison. Recent Problems with Equipment,ITTF'04.http://www.ittf.com.