2020/05/27

淺談2020中華職棒得分期望和一分以上機率矩陣

上半季已經進行了超過三分之一的比賽,職棒三十一年可說是炮火滿天飛。然而戰術的運用也相較去年更為頻繁。 本篇文章將從得分期望值和一分以上的機率來看,在特定狀況下故意四壞以及觸擊短打,是否能分別讓防守和進攻方得到利益。

作者:小楓康

請繼續往下閱讀

本季中華職棒貴為全世界第一個開打的夏季聯盟,自然引來許多外國球迷的注目,當然也多少吸引了一些原先看日職甚至大聯盟的球迷。到今天賽前為止的球賽,大家的焦點多半放在投手的爆炸以及全壘打的狂轟猛炸。和去年同期相比,聯盟的全壘打數從103支變成135支。近期的新聞也報導了彈性係數過高是全壘打激增的主因。

 

 

另一個我比較有興趣的部分是Run Expectancy,也就是得分期望值。剛好今年出現一些空檔,決定來花時間做出這項數據。如果對於數據稍有研究的球迷,大概會知道得分期望值是許多數據的基本元素。

 

基本精神和計算方式

 

得分期望值的基本精神在於將比賽劃分成24個壘位出局數,從無人出局到兩人出局3種出局狀況,壘包則是從無人在壘到滿壘,共8種壘包狀況,相乘起來就是24個壘位出局。而這24個壘位出局狀況,有些會彼此互相連結,每一個打者的表現和前一位打者並沒有關連,這個依照時間分立的馬可夫過程稱為馬可夫鍊。好,看到這邊如果想睡了,甚至連計算過程都沒有興趣,那麼可以直接看結果沒有關係。

 

而期望值的計算方式相當容易,就是把該壘位狀況出現後,到該半局結束為止,球隊到底打了多少分。比方說富邦悍將在此場球賽出現5次兩人出局二壘有人的狀況,到該局結束為止,球隊攻下6分,那麼這個壘位的得分期望值就是6分/5次,也就是1.2分。

 

每個壘位的情況就如同上述的操作以此類推,因此我們可以得知24個壘位的得分期望值。這邊再次提醒讀者們,如果要自己計算,需要計算到該半局結束為止前,球隊到底拿下多少分。

 

接下來要介紹的是得分期望值的副產品,稱為At Least One Run,也就是至少得一分的機率。它的用途主要是看在這24個壘位出局下,球隊到該半局結束後,得一分以上的機率為何。

 

 

當然其計算方式相較於期望值更為容易,舉例來說,如果悍將在整場比賽出現4次的一人出局二壘有人,且到該半局結束前,這4次都得分,那麼得一分以上的機率就是4分/4次,也就是1。當然接下來每一個壘包狀況,都可以藉由上述的算法求得其機率。

 

計算RE 24或是得一分以上機率的先決條件就是要有Play By Play,也就是整場比賽每個壘位出局的結果,如果沒有Play By Play,我們只能透過模擬的方式推敲出這兩項數據,這是計算中稍微麻煩的地方。

 

過往的許多先進曾經計算出中華職棒幾個球季的RE 24以及得一分以上的機率,但是檯面上幾乎很難看到擁有長時間的資料統計結果,最多也就是5個球季以內。想要製作這個表格,除了時間上的花費外,資料的取得也是一大難題。以目前中華職棒僅提供2014年以後的Play By Play來看,想要製作近十年來的數據是不可能的事。

 

延伸閱讀:中華職棒2014 年至2016 年得分期望值相關研究

 

接下來的部分就是重頭戲,那就是要帶球迷來探討這個球季的RE 24和得一分以上機率的表格。在介紹之前,先說明次數的計算方式。每個打席的計算自然沒有大問體,主要在於投手犯規、暴投、捕逸、盜壘成功和刺殺的計算。

 

 

在此處,投手犯規、暴投和捕逸都是分開來計算,也就是說如果一壘有人時,捕手發生捕逸讓跑者上到二壘,那麼一壘有人和二壘有人個別計算一次。但是盜壘成功和失敗時,則是計算後面那一次。這邊同樣舉例,若二壘跑者盜三壘成功,就只會計算三壘那一次。或許這樣的計算會和官方原先的計算方式有所出入,但不至於影響整體的結果太多。

 

另外此表格為參照職棒官網的Play By Play進行計算,如有不確定或是Play By Play模糊不清的地方,則會到CPBL TV調閱VOD查詢。

 

本季(至5/24日前)的期望值和一分以上的機率矩陣

 

我們就趕快來看看本季的得分期望值和得一分以上的機率矩陣,黃色為期望值(機率),綠色為次數

到上禮拜為止的得分期望值矩陣(圖片來源:自製表格)

訂閱運動視界電子報

追蹤我們