足球比赛预测

昨天读了一篇文章用文本分析来预测球员评分和推荐每周Fantasy Football阵容,这个模型已经实现在ESPN的Fantasy League里了。Fantasy的球员评分着重于一些硬性指标,比如得分犯规数量等等,与球队表现和对手强度并不完全挂钩,因此可以稍微准确的体现球队实力。

而预测比赛本身,似乎是个更难的问题。因为比起庞杂的进攻防守抢断数据,比分更加笼统,也更具有不确定性。再者,比赛的“物理现实”本身就具有极大的复杂性,就算我们知道每个球员的水平和平均得分,依旧难以预测整场的走势。2018年世界杯期间我写过一个比分模拟器,类似于FiveThirtyEight的球队强度SPI模型,原理是使用各国国家队1987-2017年的比赛数据,以本队“进攻值”和对手”防守值“的差拟合各自的柏松模型,估计进球数目。这个模型极其粗略,而且忽视了许多关联性,但是看起来已经很像回事了(虽然预测了英国夺冠很不合理,但是居然猜中了克罗地亚加时赛胜丹麦)。

今天想起这个问题,不知道以目前的机器学习工具,预测比分的工具有没有什么变化,看了眼至少2019年的论文还在用这类简单的数值模型,不知道准确性如何了

葡萄藤

家里发来照片。姥姥家的老房子搬空了。只剩下我和太姥姥一起栽下的葡萄藤,和一颗高大的香椿树。不胜伤感。我似乎还能闻见这间房木头的气味,儿时清凉的炎热夏日,初学做饭时热闹的厨房,和失去的亲人。两年没能回国错过了好多事情。没能告别老房子也是其中一桩

恰好睡前在听蔡琴翻唱的这首明月千里寄相思

夜色茫茫罩四周
天边新月如钩
回忆往事恍如梦
重寻梦境何处求
人隔千里路悠悠
未曾遥问心已愁
请明月代问候
思念的人儿泪常流

真是回忆往事恍如梦,重寻梦境何处求

《万寿寺》 – 王小波

重读王小波的《万寿寺》,说句实话,写的比他一开头引述的莫迪亚诺的《暗店街》丰富多了。《革命时期的爱情》里,王二说孩子视角里的世界会不同,“三岁时见到了什么怪景象,就以为自己做了个怪梦,傻高兴一场…像这样的记忆我们人人都有,只是没有人提也没有人来画,所以我们把它们都淡忘了”。显而易见地,王小波的记忆是吵闹炸裂的大炼钢铁,这股兴奋而惊惶的情绪把许多记忆扭曲成夸张的样子。就像是这个时代业已决不存在,所以可以任由我们捏造它的样子,来从中寻找自己,知道这二者相接,“一切无可挽回地沦为现实”,又“一切无可挽回地走向庸俗”。王二并不遗憾失去,因为王二什么也没拥有过。

相比之下我认为莫迪亚诺的童年显然是一场阴暗的雾,旧时代的遗子在纳粹的铁牢阴影里。但是莫迪亚诺笔下忧伤的中年侦探永远找不到《多拉布吕岱》或者任何属于童年的梦的根源,因为那根本就不是真实——至少不是属于所有人的真实——真实怎么会一只躲在左岸的咖啡馆里,富人街区的车库里,档案馆里,等候着被发掘呢?原来这就是我读了这几本书之后的感受,莫迪亚诺找不到的东西并不是丢了,而是压根就不在那里,那不是法国战后社会,而是咖啡馆里的一个切片,它离移民问题、战争问题、左翼学生运动,都如此之近以至于有所见闻,又如此之远以至于从未真正触碰,因此才落个苦寻不得。万寿寺从同一个地方出发——一个失忆的人开始——走向的却是另一种虚无,过去是可以随意塑形的,现实是虚妄庸俗,这二者无奈地归为了一体。

《黄金时代》- 王小波

突然想到可以从学校图书馆借书了,一口气订了好几本送到办公室对面的数学分馆,先到的是这本王小波的黄金时代。打开第一页看到陈清扬和王二的名字想起来我看过这篇不止一次了。快速翻到了最后,陈清扬在离别的火车上说,人保组把各种交代材料给她看,就是想让她明白,谁也不这么写交代。但是她偏要这么写。她说,之所以要把这件事最后写出来,是因为它比她干过的一切事都坏。这句话格外的让我心头一紧。王小波的小说很诙谐,加上满篇的性描写,有种轻佻不屑的感觉,似乎没有人、没有政治势力能真正够伤害到叙述者。相对于叙述人王二的,是其描述的世界的苦涩无奈,初读感受到的是陈清扬的心思包在王二的叙述里,王二包在文革的洪流里,文革的背景包在王小波的故事里,王小波的笔包在这位去世的作者的壳里。今天读又有些不同的感受,似乎所有组成的文字都包在了某个属于过去时间的空洞里,我虽能把脑袋伸进去窥探,但是我们正在加速离开这套话语,重新回到循环的开始…

厕纸研究

此前注意到一个现象:厨房用纸的用量与纸的厚薄和单位面积强烈相关。由于价格并不是单纯地挂钩于纸的面积/厚薄,使用某些又大又薄的厨房纸实际上成本很高。

今天在咖啡厅忽然想到了一个相关的问题,既然厕纸的大小是确定的,而区别只在于厚薄和层数,那么作为一家餐厅/咖啡厅的运营者,应该选择单层还是双层的厕纸呢?

当然,这个问题比看起来复杂,因为运营者还要考虑到用户的舒适度,而购买厕纸的价格并非由层数决定而是由供需关系决定。市场已经解决了定价问题,但是不妨碍我好奇,厕纸层数与用量的关系是怎样的,如何设置一个实验来测试这个区别…

搜索了一圈并没有找到相关论文,甚至不知道这个问题归谁管(厕纸公司肯定有人专门研究这个,但是公共研究好像并没有)。直到我搜到了UPENN的两个本科生真的做了这个实验,把学校教学楼一些洗手间的厕纸从单层换成双层并测量了使用量(承重),发现双层厕纸用量更大一些,从价格上来说贵了百分之七十多。他们还测试了贴一个贴画写着“纸来自树木”看看呼唤大自然保护欲会不会减少用量,这个也没用。

所以结论是如果我开咖啡厅,可能会供应单层厕纸。

韩式烤五花

今天逛Farmers’ Market,对象发现了卖紫苏叶的摊贩。终于找到有紫苏叶吃啦!晚饭做了韩式烤五花肉,包紫苏叶吃肥而不腻,香。五花肉切片之后用含有梨和苹果汁的烧烤酱、一点点油、和泡菜汁混合腌渍一个小时后烤熟就好。我没有韩式烤盘,用的是铸铁煎锅替代,重点是用紫苏或者生菜包着吃

听歌 (2021.9月)

Alcest 9.1

今天在听Alcest,吉他为主的器乐金属,或者叫post blackmetal,我觉得不如说是瞪鞋摇滚。2010年的这张Écailles de Lune颇有凛冽的月夜里的异教仪式感,尤其喜欢最后一首Sur l’océan couleur de fer,之前有一次听这歌恰好路过一树百十只乌鸦飞舞鸣叫,和声一起就像在铁色的海边悬崖上漆黑的一团怪异。最近两张专辑里Neige做的声音已经和这些优点区别了,也就是时不时的一嗓子金属提醒我,他还是个金属,吓我一跳。

Television 9.1

在听Television,希望纽约一日游的相片赶快洗出来,有些遗憾没能去CBGB酒吧旧址留念,其实已经走得非常近了

Dinner Party 9.3

我的2020年最佳专辑。在此基础上Remix的Dinner Party: dessert也好听,甚至加上snoop dogg在每首歌尾的几句词,像是深夜电台。Kamasi Washington太好听了

继续阅读“听歌 (2021.9月)”