2019/08/29

【數據的迷思】數字會說話 小心別被數字騙了

Let the Numbers talk. 數據。量化一個球員在球常上表現的方式,就在我之前寫投球。投手與捕手共同創作的藝術品了之後,我去請教一個我求學階段的教練如何讓文章的數字更能讓讀...

請繼續往下閱讀

SAM803

C是不是王威晨 XD

棒球貴賓狗

說好不提球員 噓🤫

小楓康

寫得不賴,適合入門和初學者閱讀,尼克楊的分析我也很愛

棒球貴賓狗

謝謝🙏 我會多參考的

Dr.song

傳說中的記錄組,我的嘴角怎麼不自覺上揚(誤XD

棒球貴賓狗

這是不能說的秘密 ~

 

Let the Numbers talk.

數據。量化一個球員在球常上表現的方式,就在我之前寫投球。投手與捕手共同創作的藝術品了之後,我去請教一個我求學階段的教練如何讓文章的數字更能讓讀者一目瞭然,這個教練曾任國家隊教練現在則是活躍於球評圈。就在我們討論文章的過程中他問了我一個問題:

兩個同樣三場比賽.333的球員三場下來成績為下,你會選擇比較相信那個球員?為甚麼?

現在回想我的答案雖然沒有錯但有點好笑

我:我選擇上壘率高的那個。

教練:如果只有這樣的數據呢?

我:那可能是B吧,A的成績比較屬於順風球的球員沒安打的那六個打席可能傷害就很大。

教練:這就是要思考的地方,而且就作戰臨場來說沒時間給你去翻資料這些是賽前的功課,數據是參考輔助但不是絕對。

聽完當下只能說略懂略懂,後來我自己的解讀就是數據能夠幫你知道球員整體狀態,但是更細節的部分要夠了解球員或是用更多數據去了解這個球員,這也是我剛剛再回答問題直接的反應,單就打擊率來說是不夠客觀的。細部的打擊數據因為有其他前輩曾經在專欄討論過了我這邊直接就簡單的範例去讓大家去思考怎樣的成績才是比較好的成績。先說!這個沒有絕對答案,每個人注重的點不同用理性的方式討論、思考。(我也沒有要黑球員會是捧哪個球員,所以我會遮起名字和隊名敬請見諒。)

C球員

D球員

兩個球員都是2019中職安打型球員兩個打擊率、安打數量都差不多,從打擊率看來C球員的表現比D球員的好,高出0.013可是在OBP 跟 SLG 看來卻輸給D球員。SLG方面就很簡單的說明這個球員預期一次打擊的壘打數,C球員的數字就是在說一壘安打佔全體安打數的大宗而且在2壘安打以上的壘打數期望值是很低的。

常在轉播時聽到如果一個球員在一個打席內消耗對方七球以上球評就會說:這是一個成功的打擊。這句話我覺得是有條件性的就是要看比賽進行到什麼階段還有對手的整體狀況。說到這個接下來來說OBP吧! 我有聽過一個說法:保送最多就一個壘包,安打還可能多個壘包我積極出棒得到的結果還可能比較好。聽到這個我只能認同一半,一個保送的過程中一定是要消耗對方四個球以上,而投手這個位子是讓他投更多球他越會出錯的角色,而這個錯誤可能是壘包上有人時挖地瓜的暴投或是突然的失投讓打者有機可乘。

可能有讀者看到以上兩個數據查一下就知道是哪兩位球員了,再聲明一次,沒有要黑或是捧,這是討論數據的可靠性。在不考慮這兩個成績的守備情況下,打擊的成績應該可以說D成績略優於C成績。

 

投手的數據

一個好投手的數據該長怎樣,勝投多?防禦率低?還是三振多?這也是一個青菜蘿蔔各有所好的問題,這邊又要分成先發與後援的不同。先發投手最基本的責任就是局數:在盡可能多的局數中把失分降到最低。這句話其實就是在形容防禦率阿!!而後援投手呢?在危機狀態下或是短局數的場合讓對方不能越雷池一步要在當下阻斷攻勢,這句話沒有直接的去說明是哪個數據可以參考,但是可以確定的是後援投手的更換頻率會比先發投手還要來的高,這樣很有可能會把責任跑者放在壘包上然後就被教練換下場如此一來失分與否就要看接任的隊友了,很有可能一個不小心ERA就因此暴漲,所以針對後援投手ERA反倒無法真實呈現。所以就要去看其他的數據來幫助自己,接下來就舉一個實際案例來看吧。(一樣會遮住名字和隊名,再次強調這是討論數據而不是討論球員)

一看到這個ERA! 真不錯呢! 但出賽12場投11局很明顯就是一個後援投手的數據,往旁邊一看WHIP值有點可怕! 2.27 投一局會讓兩個跑者上壘,很明顯這個數字不太合乎ERA還不錯的道理。來看看其他數字會幫忙解釋這些疑問嗎?

11局的內容出現7次的保送被安打數18支也送出10次三振,保送稍多了點但又有不錯的三振能力會這麼顯示數據的投手球應該有一定的能力只是控球能力還得再加油,在看安打的部分雖然這有點可怕,但是往後看滾飛比1.3而且也沒有挨過全壘打,可見這投手的投球型態偏滾地球。

訂閱運動視界電子報

追蹤我們