论文部分内容阅读
本研究选取实际工作中最常见的脚步编辑工作作为对象,基于开源的Openpose框架分析提取人物在画面中的运动姿态,进而利用支持向量机(SVM,Support Vector Machine)和多层感知器(MLP,Multilayer Perception)这两种神经网络学习方法分别对Openpose的数据进行处理,训练出针对于不同画面和运动情况的预测模型。在此过程中,对比了不同的预处理组合对模型拟合的影响,最终将其结果编码为多种音频工作站所能兼容的标准XML序列,尝试和探索在习惯、精度、实用性等方面均可