论文部分内容阅读
职业足球联赛发展蓬勃,吸引了世界各地各个行业的研究人员的注意力。自1969年起就有不少学者将目光投向职业足球比赛所蕴藏的巨大经济效益。然而,由于一些历史、政治因素的影响,职业足球联赛中涉及球员转会费用的数据一直是不对外公开的,由此导致当前针对足球职业联赛的研究常常局限于针对球员自身技巧,各个球员之间的合作交流以及俱乐部对于球队的投资等方面展开。此外,在足球转会市场这一各大豪门俱乐部展开博弈的领域,各个俱乐部在进行球员交易时仍然依据足球经纪人、球探等对球员的情报、评价信息来决定买入或卖出哪些球员以及相关的球员估值,缺乏一套可以对球员价值、俱乐部需求进行量化的方法,因此,相关领域的研究亟待展开。本文基于复杂网络理论,根据Transfermarkt网站上爬取的职业足球运动员转会数据构建数据集,针对职业足球运动员的转会规律展开深入的分析和挖掘。通过利用统计分析、网络测度分析等数据挖掘技术从历年的职业足球运动员转会记录中挖掘出隐藏的规律,并将其作为在转会市场中进行球员交易的俱乐部的决策支持以及球员进行职业规划的参考。本文的研究主要分为两个部分:足球运动员跨国转会网络分析以及基于转会网络特征的足球球员转会费预估。1.本文对足球运动员跨国转会网络分析分为空间和时间两个角度的研究:在空间角度,通过基于Java的gephi平台对所构建的转会网络进行可视化并通过定义和计算转会网络子网间的网络效率,研究发现转会网络中以国家划分子网的子网间的网络效率与国家间的地理距离成反比;在时间角度,本文基于gephi-toolkit进行二次开发,针对各赛季的转会网络计算了网络平均最短路径、模块度、网络密度等转会网络测度,并将这些网络测度随时间变化的关键拐点与各赛季的转会政策关联起来。实验结果表明根据各个赛季的转会记录所构建的转会网络所呈现的测度变化能够反映该赛季生效的政策的实际影响。2.在对基于转会网络特征的足球球员转会费预估的研究中,本文设计了俱乐部的节点度和中心性测度等俱乐部的网络测度特征,并构建了岭回归模型、Gradient Boosting回归模型等机器学习模型,实验结果表明加入了网络特征的机器学习方法改善了基于集体智慧理论的球员转会费预估方法的准确性,进一步,本文挖掘了对于球员转会费预估影响显著的特征并分析了背后的原因。