2019/06/18

《左‧外‧野︰賽後看門道,運動社會學家大聲講》─ 魔球咒語 「大數據」真能人定勝天?

《左‧外‧野︰賽後看門道,運動社會學家大聲講》的評論觸及國族、性別、文化、媒體、教育、體育政策等面向,涵蓋的運動項目以及體育名人不勝枚舉。立足台灣、放眼國際的體壇大小事,陳子軒以深入淺出的方式,將社會學與文化研究等學科觀點帶入運動評論中,既平易近人又充滿知識性。 陳子軒著 聯經出版 魔球咒語 ─ 「大數據」真能人定勝天? (以下內容摘錄自本書p.369-3...

請繼續往下閱讀

左‧外‧野︰賽後看門道,運動社會學家大聲講

 

陳子軒著

聯經出版

 

魔球咒語  ─ 「大數據」真能人定勝天?

(以下內容摘錄自本書  p.369-373)

 

大數據鋪天蓋地而來,選舉要談網路的大數據、柴靜談空污要拿大數據、醫療健康要拿大數據、相親配對要拿大數據,運動場上更是早就開啟大數據時代。

 

美國「棒球之父」柴德威克(Henry Chadwick)在現代棒球誕生之時,就將打擊率、投手自責分率(ERA)帶入棒球紀錄與報導,自此之後,棒球就一直是最常與統計學連結的運動。由於每次的投打對決都能產生出由變數交織而成的「事件」,隨著球數、壘上跑者狀況、投打慣用手等等變化,每一個場景都充滿著錯縱複雜的故事性。

 

一九七○年代末期,一個正職是工廠夜班警衛的棒球狂熱球迷詹姆斯(Bill James),開啟棒球場上一連串的「賽伯計量學」(Sabermetrics)革命,在麥可.路易士(Michael Lewis)以MLB奧克蘭運動家隊總經理比利.比恩(Billy Beane)為主角的《魔球》一書以及改編電影風潮之後,「大數據」儼然成為棒球世界的顯學。

 

除了棒球的特性與統計學是完美的結合之外,這股大數據浪潮延燒到所有你可以想到的運動,比利.比恩本尊還應荷甲足球隊AZ Alkmaar之邀,出任顧問一職,期待能將魔球模式複製在荷甲的小市場球隊身上。德甲的霍芬海姆球隊與北美國家冰球聯盟NHL都聘請著名軟體公司SAP為其提供運動數據服務,NBA也從球場攝影機連結電腦的運算,可以得出如球員跑動距離等等以往難以想像的數據。

 

然而,儘管比利.比恩從一九九八年接掌運動家隊之後,靠著魔球哲學將運動家隊塑造成球季賽常勝軍,卻僅有一次在季後賽中挺進到第二輪,也讓比恩曾經失望地坦承「我這玩意在季後賽狗屁不通」(My shit doesn’t work in the playoffs)。況且就算魔球真有其魔力,但是球場如人生,並不是靜態的,眾人紛紛採取相同戰略之時,競爭的動態性,抵銷了魔球的優勢。更別說馬克.吐溫早已參透人類的三種謊言:「謊言、該死的謊言和統計。」

 

舉例來說吧,二○一四年國家聯盟分區系列賽第四戰,面臨淘汰邊緣的洛杉磯道奇隊推出王牌左投柯蕭(Kershaw)主投。七局下半,紅雀隊零比二落後,無人出局,一、二壘有人。柯蕭整個球季在沒有人出局一、二壘有人的狀況下,沒有被打出過任何安打;面對他的則是這球季面對左投只有一成九○打擊率的左打亞當斯(Matt Adams)。在這個打席之前,柯蕭七年生涯裡投的兩千六百零四顆曲球裡,沒有一顆被左打者打出過全壘打;亞當斯生涯面對左投投出的曲球打擊率更是只有一成一一。然而,柯蕭的第兩千六百零五顆曲球投出後,直接被亞當斯送到右外野牆外,成為逆轉的三分全壘打;道奇隊也因為這一轟,提早打包回家。

 

我們要怎麼解釋這結局?當然有人說柯蕭只休息三天,這又是他投的第一百零二球,所以已經累了(但整季他一百球以後也沒被打過全壘打啊!);更有大數據魔人解釋那顆挨轟的球水平位移只有五公分,比起柯蕭平均曲球水平位移少了二.五公分。事實是,有了上述林林總總這些數據,你只要挑對了數據,怎麼說都可以。

 

大數據之所以吸引人,其實是我們還相信「人定勝天」,認為人類將一切量化之後,就可以從這些數字中找到上帝遺留的餅乾屑。但我們忽略了一點,數字本身或許是中性的,但任何牽扯到人與社會的數據背後都不是純淨的,而且一旦大數據的海量資訊大到我們無可負荷,那麼任何關於數據的資訊都必然只是以「理性」、「客觀」包裝,實則由守門人一連串選擇後的故事。

 

大數據要有效,或任何量化研究具有解釋力,前提是原始資料(raw data)必須真確,否則只是從一堆錯誤,演算出更華麗的錯誤而已。即便是懂得祕傳咒語的巫師,要煉出仙丹妙藥,那也要準備好正港的蟾蜍眼淚和鳳凰鱗片吧,否則說不定煉出的是含笑半步癲?

訂閱運動視界電子報

追蹤我們