查看: 4656|回复: 18

[原创] 浅探数据分析之二:如何挑选真·门神

[复制链接]
发表于 2023-3-29 12:24 | 显示全部楼层 |阅读模式
本帖最后由 TroldenWong 于 2023-3-29 12:24 编辑

第一篇请看:抛砖引玉探究一下这代的数据中心
https://www.playgm.cn/forum.php? ... amp;fromuid=1074577

爆棚每天上传图片有限制,加上我本身也是懒b,对于数据中心的深挖争取做到每天一点,由浅入深。另外昨天晚上测试的时候出现了游戏卡死的问题,目前不清楚是因为当时用的皮肤的问题(不过我用的是那个皮肤非常老的版本,只因为我喜欢那个ui细节,所以这个锅不能甩给人家皮肤作者)还是游戏本身在处理这方面内容时会出问题,所以建议大家可以考虑在进入数据中心之前保存游戏。

继续回到昨天聊的门将话题,我本身之前对篮球的数据统计感兴趣,篮球的统计有很多细致划分,比如说投篮命中率,可以细分到在哪个位置投篮,多远距离的投篮,有无防守的投篮等等。足球方面我发觉,影响的因素太多,控制变量变得很难,但是门将方面好像处理起来还相对简单,于是我就选择了这个切入点。统计学上的显著差距必然有本质上的原因,如果数据上的差异可以体现在数值上,那么我们有可能探寻出具体哪些数值对于球员表现是最有影响的。下面采用的数据依然是游戏进行到2026年6月20日的存档,大部分球队门将都是死操主力门将,所以我就默认门将是百分百出场的,除非有很明显的轮换门将情况。

1.弱队出门将
01.jpg
如果球队高压,有可能对面连半场都过不了,那么其实我上去守门也可以。当然这是玩笑话,但是弱队出门将这句话必然有其道理。因为后防线很差的球队,门将的表现机会必然相对多很多。如这场图所示,除了笔者操控的西汉姆,以及左下角象限新big6,英超大部分球队的场均被射门次数都是大于平均值的。唯二不是big6又有小于平均值的场均被射门次数的球队是小蜜蜂和太妃糖,而这两支球队当赛季是分列78名。我们可以从纸面上来讲,如果他们把门将升级成更好的,那么排名是很有可能上升到欧冠区的。(后面的高阶数据也能验证这一点,小蜜蜂的拉亚和埃弗顿的皮克福德的阻止预期进球数都是-2以下)
而在球队整体防守表现较弱的球队中,只有一个球队的场均失球是低于平均值的,那就是维拉,大马丁还是顶的。右上角三队除了伯恩茅斯以外两队分列正副班长,球队每场都被人射15脚以上,门将再强估计也回天乏术。而富勒姆在球队整体较弱的情况下,丢球数又只比平均值差了一点点,感觉也值得探究一下。

2.门将排排坐
02.jpg
既然大体的比较区间已经划分出来了,我们可以大体比较一下英超门将中的第一梯队第二梯队以及尽量要避免购入的部分。上图我简单对这个高阶数据图进行了一下划分。先说明一下这个图的数据其实我觉得怪怪的,因为他没有具体写这是”最近x场“的数据还是全部赛季的数据,据我的观测好像是把玩家的球队以及整个赛季所有遇到的对手都列了出来,但是又没有列出杯赛遇到的一些弱队。anyway,首先我们排除蓝色框住这部分,因为阿雷奥拉和被挡住的莱德斯马都只是替补门将,莱德斯马是我欧冠遇到的ac米兰的替补门将,麦尼昂在赛季末尾作壁上观,所以莱德斯马出战4场,这个样本自然没办法放入比较,他和我的替补门将阿雷奥拉的高扑救比应该只是在样本很小的时候出现的现象。
而排除他们两位之后,很容易就能得出结论,英超门将中的佼佼者就是上半区这6位(数字不代表排名,只是为了表述方便)。这个数据我相信是有泛用性的,不仅仅是在笔者的游戏中,在大部分玩家的游戏中也应该是这样(当然这里只有英超数据,如果能核武各路门神来英超就更方便横向对比了)。前面提到的联赛倒数的伯恩利沃特福德和伯恩茅斯,他们的门将分别是橙色的2号穆里奇3号现实中狼队的萨以及1号在诺丁汉森林踢过几年现实中去了朗斯的桑巴。球队整体防守较好但丢球偏多的布伦特福德和埃弗顿的门将是拉亚和皮克福德,在这个图表中也是倒数的菜菜。顺道提一嘴昨天也提到的左下角这两位卧龙凤雏,分别是圣徒的巴祖努和布莱顿的桑切斯,抛开他们现实中表现不谈,很多人都反映过他们俩在游戏中不好用,这个图表也非常直观的显示出他俩的表现之烂(可以猜一下哪个是巴祖努哪个是桑切斯)

3.数值具体如何影响扑救表现(淦,上传错了一张图片导致今天上传图片大小爆了,只能把图片压缩再发)
03.jpg
这里粗略统计了上面提到的13位英超主力门将,只统计了他们的联赛表现,因为杯赛遇到的对手水平实在参差不齐,而联赛对手水平统计学上可以认为近乎相同。把他们的【扑救比】和【场均预期扑救】作为因变量(顺道提一嘴,场均预期扑救的翻译实际就是场均阻止预期进球,后者好像更容易理解一些),我自己根据理解挑选了15个我认为可能会影响门将扑救率和预期扑救的数值,然后算了一下每个数值和两个因变量的相关系数。图片很糊所以我简单说一下结论,这里因为样本太少,加上数据都是在范围很小的一个区间,这个结论肯定是不准确的,但是还是很明显看出,【手控球】【防守站位】【集中】【决断】【预判】以及【弹跳】对于扑救比和场均预期扑救都是有较为明显的正面相关性的,换句话说在挑选门将的时候,在其他数值差别不大的情况下,可以尽量挑选这6项数值较高的。【拦截传中】这一项居然出现了负相关倾向,有可能是因为样本太少出现了统计学上的误差,也有可能是这一项的体现是在球队整体防守而非门将自身,后者也体现在【指挥防守】这项相关性近乎为零上。
总体来讲我个人感觉,数据的差异虽然未必体现在具体数值,因为影响表现的因素实在太多;而用数据倒推数值,也许只有在门将这种受其他队友和环境影响较小的位置上可以尝试一下。另一方面,现代足球往往还要求门将可以离开己方禁区进行策应甚至发动进攻,以上的探究只涉及门线技术,怎么能让球队减少预期失球,门将对于球队表现的影响还体现在很多方面,这里不多做深究。纸上谈兵,浅尝辄止,下期再见
 楼主| 发表于 2023-3-30 08:06 | 显示全部楼层
hothuman1314 发表于 2023-3-29 20:48
这是统计一个赛季的数据吗,我觉得样本还是不够大吧,足球比赛的随机性非常大,不同赛季乃至不同的开档下每 ...

另外你提到的球队打法对门将表现造成影响这里,我已经在主贴以及前篇里探讨过,被射门多的球队守门员自然绝对扑救次数多,但扑救率是相对的,等于说我们在无从得知场均被射门20次扑救19次的守门员在场均被射门40次的情况下能不能做出38次有效扑救的前提下只能认为扑救率不随比赛其他因素影响(这里我简单默认门将体力无限且不会受伤),所以大样本下的扑救率应该可以抵消球队打法的影响。
还有就是统计数据中,太多数据我无法判定互相之间如何影响,甚至无法判断是否有包含或因果关系,因为我没有接触过现实足球的数据统计。比如说门将的拦截传中成功率(或者场均拦截传中次数),我从脑海中推演的情况是,门将成功拦截传中,可以减少对方有效射门,因此拦截传中对球队整体防守表现是有促进作用的,但是无从知晓这个促进关系的相关性,因为对球队整体防守表现的影响因素实在太多,甚至对门将是否需要做出拦截传中动作的影响因素也太多(有可能其他防守队员给予帮助),数据来源不够细致。再比如门将出击,好的门将出击甚至可以让对方无法射门,这种情况肯定不会计入扑救统计,但这样的统计在游戏中是没有的(现实中不清楚),只能用比较粗略的方法计算也是妥协之举
 楼主| 发表于 2023-3-30 07:52 | 显示全部楼层
hothuman1314 发表于 2023-3-29 20:48
这是统计一个赛季的数据吗,我觉得样本还是不够大吧,足球比赛的随机性非常大,不同赛季乃至不同的开档下每 ...

一个赛季的样本确实很小,只不过我本人并没有能力测试多个档多个赛季的数据,因此这里只是抛砖引玉,希望提供一个测试的思路。
另外你提到随潜的问题,这里其实并不涉及到潜力,也不涉及随机,我只是把他们的面板数值列了出来(现在回头来看隐藏中有几项也应该考虑加进来),巴祖努哈祖努桑祖努其实没有本质区别,我相信如果数据样本够大的情况下,是有机会探寻出一个影响扑救率和阻止预期进球的因素组以及他们之间的线性关系的(虽然我估计这个关系问SI直接要可能更简单),到那个时候,只要把门将的具体数值输入,就能大体算出一个扑救表现的区间,而这些和【具体是哪个球员】以及【球员的潜力】没什么关系
发表于 2023-3-29 20:59 | 显示全部楼层
门将的职责设置不同侧重的属性和打法肯定也不一样,球队是高压控球打法后面放个蹲坑门线型门将那他很可能表现一般,球队是蹲坑防反打法后面放个出击倾向高的门将那他的表现估计也不会太好,英超放个180多弹跳制空低的门将很大概率被打爆,但是在西甲可能影响就没那么大,当然ca在150以上的门将基本上就没什么短板了,而且会有两三个超强点,跟球队打法契合的话就算是好门将了,实战表现也会很不错
 楼主| 发表于 2023-3-29 17:41 | 显示全部楼层
午夜狂鸣 发表于 2023-3-29 15:55
学习了,期待各个位置上面的更新

应该是没有其他位置的了,因为其他位置影响的东西太多,也不能保证完全主力出场,有轮换的问题,门将基本联赛打满,统计学上可以近似认为其他变量相同
发表于 2023-3-29 12:48 | 显示全部楼层
找个正经的网盘或者图床保存你的图片,直接在帖子里插入图片链接
发表于 2023-3-29 13:10 | 显示全部楼层
拉姆斯代尔-4。。。。。。。。。。。
发表于 2023-3-29 14:13 | 显示全部楼层
卡内塞齐和阿姆斯戴尔都已经在阵中了!
发表于 2023-3-29 15:17 | 显示全部楼层
留名66666666666666666
发表于 2023-3-29 15:55 | 显示全部楼层
学习了,期待各个位置上面的更新
发表于 2023-3-29 19:22 | 显示全部楼层
写的真好,期待更多类似的文章
发表于 2023-3-29 20:48 | 显示全部楼层
这是统计一个赛季的数据吗,我觉得样本还是不够大吧,足球比赛的随机性非常大,不同赛季乃至不同的开档下每个球队的表现很可能都是不一样的,球队的表现对门将的影响还是很大的,门将的表现跟自身属性肯定是关系最大,跟球队打法的契合性也有关系,不能一概而论,而且这里面还有门将是随潜的,巴祖努随到160以上那属性游戏里排个前10甚至前5我觉得都不算夸张,基本没有短板,关键属性全15以上,出球还好,经常一个大脚前场叼飞盘就形成机会,神仙扑救出击也不算少,实战中我觉得很顶了
发表于 2023-3-29 21:10 | 显示全部楼层
扑救比前三基本不会错
发表于 2023-3-30 08:17 | 显示全部楼层
写的真好,学习了
发表于 2023-4-20 16:42 | 显示全部楼层
想请教楼主使用的因变量与自变量的函数关系是什么?我想试着分析别的数据。
 楼主| 发表于 2023-4-22 09:07 | 显示全部楼层
theodore1237 发表于 2023-4-20 16:42
想请教楼主使用的因变量与自变量的函数关系是什么?我想试着分析别的数据。

相关性分析或者相关系数计算,我直接用excel套公式做的。另外前几天问了一下chatgpt,应该是可以做多个自变量的复合相关分析。
发表于 2023-4-23 18:16 | 显示全部楼层
期待楼主做个视频,这样更受教
 楼主| 发表于 2023-4-24 06:49 | 显示全部楼层
xianzhao 发表于 2023-4-23 18:16
期待楼主做个视频,这样更受教

这玩意有啥可做视频的...本质上就是个统计学问题,我相信论坛里比我更了解数据分析的人多太多...
发表于 2023-4-25 17:56 | 显示全部楼层
这个就叫专业
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|Archiver|爆棚小组 PlayGM论坛

GMT+8, 2024-6-2 17:21 , Processed in 0.052774 second(s), 20 queries , Gzip On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表