• 设为首页
  • 点击收藏
  • 手机版
    手机扫一扫访问
    迪恩网络手机版
  • 关注官方公众号
    微信扫一扫关注
    迪恩网络公众号

神算不如天算?



    神算不如天算?

    二○○八年,美國大選前夕,統計學家奈特·席佛(Nate Silver)預測奧巴馬將會勝選,同時公佈自己對美國五十個州、三十五個參議員的心水選擇,結果近乎百分百全中。當時美國社會為之譁然,對其預測能力拜服不已,但席佛卻不以為然,直言跟他擅長的棒球系統演算法之複雜程度相比,政治預測不過是小菜一碟。

    政治神算子

    統計學和演算法,一般甚少出現在大衆視野之下,除非涉及統計的預測和分析,直接或間接跟他們自身的利益有關。席佛引人注目的“神算本領”,便是其中的例子。這位數學和統計奇才,自小對數字興趣濃厚。在他成長的年代,其他六歲的小孩或許仍着迷於玩具,他卻“人細鬼大”,學着大人預測美國棒球聯賽的賽果。席佛在芝加哥大學主修經濟,亦曾往倫敦政經學院研習一年,大學畢業後受聘於畢馬威(KPMG)會計事務所。

    工作之餘,席佛利用統計知識和演算法,在二○○三年研發了一套名為“球員經驗比較與最佳化測驗演算法”的系統(簡稱PECOTA),是現今公認預測棒球選手表現最準確的系統。PECOTA對每一位美國棒球大聯盟球員的球季表現進行統計預測,在其面世後六年,一直成為體育分析界衡量球員表現的權威標準。該系統之所以引人注目,在於其大膽卻精準的預測結果, 例如今季行內外一致看好的大熱球隊,經席佛的演算法預測,會在下一季形勢逆轉,大熱倒灶。 完全排除過往的歷史記錄,席佛得出看似荒謬的預測結果, 卻在往後的賽季一一成真。 由於精準度奇高,美國棒球資料權威網站“棒球章程”(Baseball Prospectus) 向席佛買下PECOTA,他亦成為了該網站的管理合伙人。

    然而真正讓美國人認識到席佛的驚人天賦,是二○○八年美國總統大選。大選前,席佛化名“波布蘭諾”,成立了“五三八”網站,經常發表文章和選情預測。同年五月,北卡羅來納州和印第安那州初選結束後,席佛以其建立的運算模型,如他在棒球界預測的一貫做法,得出完全逆當時主流民意的預測,惹來各方冷嘲熱諷。傳統上,兩州的選情異常緊張,但席佛預言奧巴馬將大幅領先十三至十四個百分點。最後的結果,恰好是奧巴馬贏了十四個百分點。如果這看起來不過巧合,席佛以下的預測或許會讓閣下改觀:在全美五十個州的選舉結果之中,席佛準確預測四十九個州的結果,而三十五名參議員的選舉結果更是百發百中。翌年,他被美國《時代》雜誌列入“世界具影響力百大名人”之一。四年後的大選,席佛重施故技,除了再次成功預測奧巴馬連任,所有州份的選舉預測結果更是全中。

    當不少美國人對“波布蘭諾”的預測能力嘖嘖稱奇、各界亦爭相忙於把席佛捧上天的時候,他卻未有被勝利衝昏頭腦,更明言若論演算法的複雜程度,棒球統計的模型,比政治預測模型至少複雜兩倍半以上。

    探求數據下的謎底

    一個看似天機可以隨時從上帝手上下載的凡人,自然引伸出一個簡單的問題:所謂的主流民意調查,到底還具有甚麽意義?換句話說,在席佛眼中,若政治預測不過是小菜一碟,那同樣由專家把關的民調,為何近年在重大選舉預測中卻頻頻失準?

    對於這位統計學奇才而言,數據和資料的質量固然重要,但如何將其解讀才是決定成敗的最關鍵因素。預測準確的難度,在於能否在海量的大數據中去蕪存菁。如果將毫無意義的雜訊,誤當至關重要的訊號,所得的預測自然有偏差。過分依賴單一角度解答問題,同樣是預測分析的大忌, 亦即英國哲學家以賽亞 · 伯林(Isaiah Berlin)在其論文中引述的“刺蝟和狐狸”。這個源自古希臘詩人阿爾基羅庫斯的寓言,認為狐狸懂得很多事情,但刺蝟卻只懂得一件大事。伯林將其引伸為世界上兩類的哲學家:“刺蝟型”通常僅透過單一觀點或系統來觀照世界,“狐狸型”則懂得追尋多種不同經驗與事物,並有海納百川,再將知識融為一體的本事。

    以伯林和席佛的觀點,去了解近年主流政治民調預測失準的現象,無疑有一定的參考價值。以去年美國大選為例,席佛認為過度自信,通常是預測出錯的主因之一。這類預測者擅於歸納,卻只會堅守自己的所謂原則,面對排山倒海的新訊息,他們卻無動於衷,遑論修改原先的預測。另一個預測者常犯的錯誤,是忽略調查樣本以外的重要資訊。從《經濟學人》到《紐約時報》,他們的民調背後,無一不先以自身的意識形態出發,對特朗普當選會對美國民主構成重大威脅高談闊論,對其他可能影響選民意向的議題,則幾乎視而不見。最終結果證明,左右美國選民投票決定的,都是最直接影響民眾生活的經濟和移民問題。

    類似的情況,也發生在六年前的澳大利亞大選。當年投票日前的兩個星期,執政聯盟和在野工黨叮噹馬頭,主流民調則一致認為工黨會以些微差距勝出。就連博彩公司都認定選舉結果缺乏驚喜,在投票當天已經提早派彩,冷不防開票結果卻教人大跌眼鏡,尋求連任的前總理莫里森竟然爆冷勝選。令人意外的結果,當年引來不少學者撰文分析,其中包括諾貝爾物理學獎得主施密特(Brian Schmidt)。他認為主流民調異口同聲的結果相當奇怪,從數學的邏輯去看根本不可能。在數據有限的情況下,隨機抽樣的代表性亦相對降低。當樣本出現錯誤,自然降低了研究結果的準確性。

    數學從來最老實,所有民調結果一致,施密特一口咬定必有人為操控的因素。而所謂的操控,可能跟羊群心理、預設的政治立場等有關。為了避免估計失準的尷尬釀成公關災難,民調機構可能以統計學上的“平滑”方式處理數據,去順從主流預期的“標準答案”。若“民意”淪為一種政治操控的工具,在關鍵時刻,沉默的大多數,自然會親自示範什麼才是真正的民意。



    杜然(文化評論員)



19

鮮花
52

握手
27

雷人
23

路過
58

雞蛋

該文章已有0人參與評論

請發表評論

全部評論

扫描微信二维码

查看手机版网站

随时了解更新最新资讯

400-123-45678

在线客服(服务时间 9:00~18:00)

在线QQ客服
地址:上海市虹口区武进路齐浜大厦456号2幢10楼
电邮:green_ps@ppap.com.cn
移动电话:13301215647

Powered by Discuz! X3.4© 2001-2013 Comsenz Inc.