2016/02/20

棒球能被精準預測嗎?

每年大聯盟球季尚未開打前,球迷唯一能做的事情就是預測自己支持、或是其他值得關心的球隊,以解無球可看之無趣以及急切的心情。以更專業的角度來說,預測也幾乎是我們對各支球隊必須有的大致輪廓和概念;被預測有機...

作者:JK47

請繼續往下閱讀

每年大聯盟球季尚未開打前,球迷唯一能做的事情就是預測自己支持、或是其他值得關心的球隊,以解無球可看之無趣以及急切的心情。以更專業的角度來說,預測也幾乎是我們對各支球隊必須有的大致輪廓和概念;被預測有機會可以衝擊季後賽的球隊該在市場上扮演買家、被預測將會輸大於勝的球隊則反倒該扮演賣家;不管是對球隊還是對球迷來說,預測都是很重要的事情,理由為這是我們在球季開打前,唯一能衡量各支球隊實力的方式。由於最近大聯盟各支球隊的休賽季異動已漸漸塵埃落定、每支球隊的球員名單也有大致的雛型,因此我認為現在是很適合和各位讀者談棒球預測的時機。

 

美國進階數據網站Fangraphs的電腦預測系統,不久前推出了2016球季針對所有30隊的勝場預測,在球季開打以前,這大概都會是很有價值的參考品,至少可以讓我們知道現在各支球隊身處的位置。不過我想球迷常常對這些預測自然而然的會有下列疑問:棒球預測準嗎?可靠嗎?很多人認為,球打了才會知道,預測只是僅供參考,至於準確性?電腦能懂什麼棒球?因此,這篇文章要帶大家探討的便是回顧過去的預測,來看看往年季初的棒球勝場預測,這些預測到底是準的嚇嚇叫、還是跟隨便亂猜的結果沒兩樣?預測系統可以比人類的腦袋更能精確衡量棒球嗎?球真的要打了才知道、預測的準確性只能僅供參考而已嗎?讓我們來找出答案。

首先我認為值得一提的是,之前我在分析馬林魚陣容的文章中提到下列這段話:

預測系統準嗎?我手上有從2005年至今,共八個預測系統Pecota、Steamer、Zips、Marcel、Davenport、Diamond Mind、Fangarphs、Cairo每年季初的球隊勝場數預測,這八個預測系統在美國都相當具有公信力。

 

我所做的是事情是把每一個預測系統的預測勝場數平均,得出一支球隊該球季的預測值。我決定只看比較近期的樣本,因此我鎖定了2010年至去年間,總共6年180隊的樣本然後找出和現在的馬林魚預測值相近的球隊最後實際拿下的勝場數。我找出了這210隊中,所有季初被預測可以拿下79~83勝的隊伍,剛好把馬林魚的81勝預測夾在中間。結果過去六年共有51支這樣的隊伍,那麼這些球隊最後拿下了多少勝場呢?我們來看看:

 

贏超過90勝的隊伍:11隊

贏85-89勝之間的隊伍:9隊

贏80-84勝的隊伍:8隊

贏70-79勝的隊伍:14隊

贏60-69勝的隊伍:9隊

51支球隊平均勝場數:80.4勝

 

我必須先澄清沒有去刻意捏造數字;事實上就是,過去六年共51支被預測可以拿下79~83勝的球隊,他們最後平均下來拿了80.4勝。長期下來,你可以清楚看見預測系統預測出來的數字是相當精確的,只要你給他夠大的樣本數。這裡頭當然也有贏超過90勝和輸超過90場的球隊,但預測的精隨本來就是要用長期的大樣本來證明是準還是不準

 

如同我之前在文章所講的,刻意去挖出單一測不準的例子是錯誤的實驗精神;要證明預測準不準,你必須要看夠大的樣本。拿一支季前被預測可以拿90勝、但最後只拿75勝的球隊來當成預測系統不準是完全沒有數學改概念的事情;我們不會因為隔壁鄰居生了八個小孩,就說專家預估台灣少子化的問題越來越嚴重是個笑話;因為平均下來台灣的出身率確實一直在降低。也因此,我會仿照上一篇文章的做法,拉出過往數個球季的樣本,並看看那些被預測可以拿X勝的球隊,最後實際勝場數離X多遠。棒球能被精準預測嗎?下面你會找到解答。

首先,我找出上述八個預測系統,在2010~2015年共六季之間,對於聯盟所有球隊的勝場數預測(所以總共有180支球隊的預測值),並計算出平均值,最後用其來比對實際的勝場數。以下表格就是答案:

2010-2015預測系統預測成果

被預測勝場數範圍 總隊數 所有球隊該季實際累積勝場 平均每隊勝場
100勝以上 0 0 0
96~100勝 0 0 0
90~95勝 17 1531 90.1
85~89勝 40 3496 87.4
80~84勝 54 4387 81.2
75~79勝 32 2506 78.3
70~74勝 26 1934 74.4
65~69勝 9 619 68.8
60~64勝 2 115 57.5

訂閱運動視界電子報

追蹤我們