昨天读了一篇文章用文本分析来预测球员评分和推荐每周Fantasy Football阵容,这个模型已经实现在ESPN的Fantasy League里了。Fantasy的球员评分着重于一些硬性指标,比如得分犯规数量等等,与球队表现和对手强度并不完全挂钩,因此可以稍微准确的体现球队实力。
而预测比赛本身,似乎是个更难的问题。因为比起庞杂的进攻防守抢断数据,比分更加笼统,也更具有不确定性。再者,比赛的“物理现实”本身就具有极大的复杂性,就算我们知道每个球员的水平和平均得分,依旧难以预测整场的走势。2018年世界杯期间我写过一个比分模拟器,类似于FiveThirtyEight的球队强度SPI模型,原理是使用各国国家队1987-2017年的比赛数据,以本队“进攻值”和对手”防守值“的差拟合各自的柏松模型,估计进球数目。这个模型极其粗略,而且忽视了许多关联性,但是看起来已经很像回事了(虽然预测了英国夺冠很不合理,但是居然猜中了克罗地亚加时赛胜丹麦)。
今天想起这个问题,不知道以目前的机器学习工具,预测比分的工具有没有什么变化,看了眼至少2019年的论文还在用这类简单的数值模型,不知道准确性如何了