400-010-3808

收藏我們

行業資訊

Industry Information

伍強課堂:世界杯預測中的(de)數學原理(lǐ)
項目啓動時(shí)間:2023-01-03
分(fēn)享至:

        第22屆足球世界杯已落下(xià)帷幕,這(zhè)一屆世界杯最大(dà)的(de)赢家是阿根廷,是梅西,更是億萬期盼梅西封神的(de)球迷。将近一個(gè)月(yuè)的(de)比賽跌宕起伏、精彩紛呈。球賽開始前和(hé)比賽期間,預測結果更是成爲球迷們的(de)最大(dà)興趣。世界上的(de)各大(dà)媒體,電視台,也(yě)紛紛加入到預測中來(lái)。我雖然算(suàn)不上一個(gè)具有專業水(shuǐ)準的(de)球迷,但也(yě)禁不住周邊朋友們熱(rè)鬧場(chǎng)面的(de)誘惑,對(duì)多(duō)場(chǎng)比賽結果進行預測。

        預測的(de)最大(dà)樂(yuè)趣是增加了(le)看球的(de)樂(yuè)趣,本來(lái)是一場(chǎng)與自己無關的(de)比賽,因爲有了(le)預測,就特别期望自己預測正确。而且一旦結果與預測一緻,那種成功的(de)喜悅,很難用(yòng)語言來(lái)形容。

        預測足球比賽結果是一門技術活,首先要對(duì)球隊有比較深入的(de)了(le)解,包括球員(yuán)構成、綜合能力、曆史戰績、世界排名、當家球星、球員(yuán)狀态、對(duì)手情況等,了(le)解越多(duō),預測似乎就越準确。但實際情況往往出乎意料甚至大(dà)相徑庭。以牛津大(dà)學預測爲例,他(tā)們用(yòng)自己的(de)數學模型計算(suàn)出來(lái)的(de)預測結果如圖1所示。

圖1 牛津大(dà)學給出的(de)預測模型

        從圖1可(kě)以看出,盡管引入了(le)非常複雜(zá)的(de)數學計算(suàn),并對(duì)各隊的(de)曆史數據,交戰結果做(zuò)了(le)詳細的(de)分(fēn)析,但預測結果卻不盡人(rén)意。小組賽也(yě)就有一半預測對(duì)了(le)勝負,其中進入決賽的(de)兩支隊伍都錯了(le)。其他(tā)很多(duō)預測機構也(yě)大(dà)緻相同。

        其實,影(yǐng)響比賽結果的(de)因素很多(duō),球隊實力固然非常重要,但進入32強的(de)球隊大(dà)部分(fēn)實力都不弱,尤其是進入淘汰賽階段更是如此。這(zhè)時(shí)候,球隊的(de)戰術安排,球員(yuán)臨場(chǎng)狀态、取勝欲望、團隊配合等方面就顯得(de)尤爲重要。此外,運氣也(yě)是比賽的(de)一部分(fēn),并且往往成爲左右比賽結果的(de)非常重要的(de)因素。

        足球比賽既考驗雙方的(de)能力,也(yě)是對(duì)雙方隊員(yuán)面對(duì)面比拼時(shí)心理(lǐ)素質的(de)檢驗。盡管結果不可(kě)預知,但其中卻蘊含有嚴謹的(de)數學原理(lǐ)。今天我們就談談這(zhè)個(gè)問題。

        大(dà)家知道,概率論是解決我們日常生活很多(duō)問題的(de)重要數學理(lǐ)論。越來(lái)越多(duō)的(de)足球預測,都是以概率論作爲基礎進行的(de)。上述牛津大(dà)學的(de)預測也(yě)是基于概率論的(de)。但概率論如何運用(yòng),卻是有很多(duō)講究。

        一般來(lái)說,在一個(gè)非受限空間,一個(gè)獨立事件發生的(de)概率總是符合正态分(fēn)布的(de)。其定義是:若随機變量X服從一個(gè)位置參數爲μ、尺度參數爲σ 的(de)概率分(fēn)布,且其概率密度函數爲:

        則這(zhè)個(gè)随機變量就稱爲正态随機變量,正态随機變量服從的(de)分(fēn)布就稱爲正态分(fēn)布,記作X~N(μ,σ2),讀作X服從N(μ,σ2),或X服從正态分(fēn)布。圖2是正态分(fēn)布分(fēn)布密度函數曲線圖。

圖2 正态分(fēn)布函數曲線(來(lái)源于網絡)

        當實際發生概率很小時(shí),我們稱其爲小概率事件,從标準概率分(fēn)布圖中可(kě)以看出,位于區(qū)間(-3σ,3σ)以外的(de)概率小于0.2%。所以,在很多(duō)場(chǎng)合下(xià),就不予考慮。比如,我們在物(wù)流系統中采用(yòng)稱重法來(lái)檢驗圖書(shū)揀選的(de)準确性時(shí),就是選取了(le)這(zhè)一标準。在很多(duō)工業場(chǎng)合,标準會進一步提高(gāo),比如我們常說的(de)6σ檢驗标準,就要求達到(-4.5σ,4.5σ)範圍,其精确度将達到3.44ppm(即百萬分(fēn)之三點四四)。

        再回過頭來(lái)看世界杯。如何運用(yòng)數學原理(lǐ)進行比賽的(de)預測呢(ne)?這(zhè)是一個(gè)比較複雜(zá)的(de)問題。如果單就一場(chǎng)球來(lái)看,其實就是實力對(duì)比說了(le)算(suàn),作爲一個(gè)獨立事件,沒有參考數據,很難做(zuò)出準确預測。比如德國對(duì)日本,一般情況下(xià),大(dà)家預測都認爲日本會輸。但是要進一步定義輸的(de)概率和(hé)輸的(de)比分(fēn),就比較複雜(zá)了(le)。這(zhè)就牽涉到一個(gè)概率問題。比如說德國輸的(de)概率,其實我們可(kě)以讓他(tā)們踢1000場(chǎng)球,看看比分(fēn)會如何分(fēn)布,這(zhè)樣結果就出來(lái)了(le)。但實際上做(zuò)不到。因爲即使集中踢1000場(chǎng),這(zhè)個(gè)結果也(yě)是有問題的(de),它與我們擲1000次硬币的(de)情況有很大(dà)不同。因爲比賽受到人(rén)爲的(de)幹擾。其結果與自然發生的(de)有出入。而實際上,集中踢1000場(chǎng)在時(shí)間上也(yě)沒有可(kě)能。所以,我們在預測一場(chǎng)球時(shí),就顯得(de)很困難,事實上因爲事件的(de)随機性而變得(de)無法預測。如果我們假設德國和(hé)日本踢1000場(chǎng)球的(de)結果是600勝,300平,100負,這(zhè)一結果對(duì)指導預測其實幫助不大(dà),但如果聯系到曆史的(de)比賽,我們還(hái)是會做(zuò)出比較可(kě)信的(de)預測。另一方面,我們把一場(chǎng)球放到一個(gè)系統中看,将會又是一番景象。比如我們将德國對(duì)日本比賽放到一個(gè)大(dà)的(de)空間,如世界杯大(dà)賽這(zhè)個(gè)環境看,德國屬于第一梯隊,日本屬于第三梯隊,這(zhè)樣看的(de)樣本空間就大(dà)得(de)多(duō)。因爲有大(dà)量的(de)第一梯隊與第三梯隊比賽的(de)樣本可(kě)供參考。我們可(kě)以從這(zhè)些曆史樣本中得(de)出一些有用(yòng)的(de)結論,如雙方曆史上的(de)勝率,本屆已經完成的(de)比賽的(de)情況等,從而指導預測的(de)結果。

        在小組賽期間,我們知道,每個(gè)小組内的(de)強弱還(hái)是比較分(fēn)明(míng)的(de)。這(zhè)樣大(dà)家的(de)預測總體來(lái)說準确性要高(gāo)一些,這(zhè)是我們應用(yòng)概率論的(de)基礎。但另一方面,我們也(yě)要看到,比賽結果還(hái)是有一定比例的(de)場(chǎng)次出乎大(dà)家的(de)意料之外。比如亞洲球隊的(de)爆發,日本連勝德國和(hé)西班牙,使得(de)德國最終小組未能出線。開始時(shí),很多(duō)中國球迷擔心亞太區(qū)球隊會被剃光(guāng)頭,但事實上,不僅有3支球隊(含澳大(dà)利亞)順利出線,而且每支球隊都有上佳表現。對(duì)此,我開始就大(dà)膽提出兩個(gè)假設:第一是亞洲球隊必定會有球隊進入第二輪;第二是比賽必定會有冷(lěng)門産生。通(tōng)過對(duì)各小組進行分(fēn)析,首先把出線的(de)球隊寄托在日本、韓國身上,并将日本對(duì)德國、韓國對(duì)西班牙、沙特對(duì)阿根廷三場(chǎng)比賽定義爲最容易爆冷(lěng)的(de)比賽。其中之所以定義沙特對(duì)阿根廷會爆冷(lěng),則基于阿根廷是奪冠大(dà)熱(rè)門的(de)假設,并且其此前已經35場(chǎng)不敗的(de)記錄,已經平了(le)世界紀錄。概率論的(de)理(lǐ)念就是:阿根廷即使要破世界紀錄,也(yě)隻會破一點點(小概率事件),也(yě)就  是說最多(duō)再赢1~2場(chǎng);阿根廷要想奪冠,就不能在淘汰賽輸球,小組賽輸球是其唯一機會。因此,其輸給沙特的(de)理(lǐ)由最充分(fēn)(第一場(chǎng)可(kě)能性最大(dà))。比賽的(de)結果印證了(le)這(zhè)一猜想。

        到了(le)淘汰賽階段,大(dà)家對(duì)預測英國和(hé)法國比賽産生分(fēn)歧。認爲兩隊水(shuǐ)平相當,英國更勝一籌。但實際過程看,是英國幾乎沒有希望。但既然是預測,邏輯上要有一緻性才行。很多(duō)機構預測法國和(hé)巴西争奪冠軍,這(zhè)是有一定道理(lǐ)的(de),事實上要做(zuò)到這(zhè)一點,兩隊在淘汰賽中,它幾乎就不可(kě)能會輸。要怎麽樣才會輸呢(ne)?需要爆冷(lěng)才會輸。我們知道,在世界杯上,爆冷(lěng)是有其必然性的(de)。從曆史數據看,總會有一定比例的(de)比賽會爆冷(lěng),有些還(hái)是大(dà)冷(lěng)門,這(zhè)就不是小概率事件了(le)。法國輸給英國根本就不算(suàn)冷(lěng)門,法國隻有輸給像澳大(dà)利亞這(zhè)樣的(de)隊伍才是大(dà)冷(lěng)門。另一邊就不同了(le),巴西對(duì)克羅地亞,結果是巴西爆冷(lěng)出局;西班牙對(duì)摩洛哥(gē),同樣是西班牙爆冷(lěng)出局;到了(le)葡萄牙對(duì)摩洛哥(gē),其實已經不是爆冷(lěng)了(le),葡萄牙隊内出現嚴重問題,才使得(de)摩洛哥(gē)一舉擊敗葡萄牙,挺進4強。

        其實,後面的(de)4場(chǎng)比賽,結果早就失去懸念。盡管他(tā)們的(de)能力差異在毫厘之間,但再爆冷(lěng)的(de)幾率已經很低了(le)。其一是克羅地亞和(hé)法國進入決賽,這(zhè)幾乎是不可(kě)能的(de)結果,因爲這(zhè)種重複上屆比賽結果的(de)可(kě)能性微乎其微,曆史上隻有一次,而且克羅地亞水(shuǐ)平本來(lái)就有限,打敗巴西,進入4強已經是超水(shuǐ)平發揮。其二是梅西封王衆望所歸,4次沖擊冠軍,無果而終,本屆比賽,将是梅西最後的(de)機會。梅西占盡了(le)天時(shí)地利人(rén)和(hé)。人(rén)們無法想象沒有獲得(de)世界杯的(de)梅西,會如何與其球王身份相匹配。第三是法國衛冕也(yě)是難上加難。試問,世界上除了(le)巴西衛冕成功過一次外,還(hái)有誰能獲得(de)這(zhè)份殊榮?以法國足球的(de)底蘊,根本不可(kě)能達到這(zhè)一高(gāo)度。

        所以,同樣是概率論的(de)應用(yòng),在臨場(chǎng)操作時(shí)應該從多(duō)方面考慮,而不能僅僅局限于一個(gè)維度。比如,預測決賽會不會出現帽子戲法這(zhè)一事件,有幾個(gè)因素支持這(zhè)一預測,第一是全部21屆比賽,居然出現了(le)52個(gè)帽子戲法,平均每屆2.47個(gè),本屆比賽還(hái)隻有1個(gè),這(zhè)是不正常的(de);第二,從決賽的(de)氛圍來(lái)看,從兩隊的(de)風格來(lái)看,從球星的(de)能力和(hé)機會看,完全是有可(kě)能的(de),并且可(kě)能是大(dà)概率事件。

        世界上的(de)事情,往往都包含有一定的(de)數學原理(lǐ),被數學原理(lǐ)所制約。但即使如此,由于未來(lái)的(de)不确定性仍然使得(de)預測不可(kě)能百分(fēn)之百準确,預測歸根到底是一種猜測,它不代表結果的(de)确定性。我們知道,再小的(de)概率也(yě)是可(kě)能發生的(de),但如果我們明(míng)白背後的(de)邏輯,将會使得(de)猜測準确性更高(gāo)。足球比賽尤其如此。因爲,每場(chǎng)比賽雖然時(shí)間很長(cháng),但進攻到禁區(qū)并且獲得(de)得(de)分(fēn)的(de)機會卻不多(duō)。所謂的(de)偶然性就成爲左右比賽結果的(de)重要因素。強隊如果沒有抓住機會,反而被弱隊抓住寶貴的(de)機會,結果就會逆轉,這(zhè)也(yě)是足球最具有魅力的(de)地方。當然,強弱如果是一邊倒的(de)情況,所謂的(de)偶然性基本是不可(kě)能發生的(de)。


圖片來(lái)源于網絡

蜂鳥中台

立即前往 >

無憂服務

立即前往 >

行業方案

立即前往 >

聯系我們

sales@vstrong.com

在線服務

服務熱(rè)線

400-010-3808

TOP