第一章 機率基礎
學習統計學之前,得知道統計學之母 - 機率。所以接下來就讓我們進入統計學世界前的機率介紹吧。
前言
數字(Number)分為絕對數字與相對數字。他們的差異如下表所示。
| 特性 | 絕對數字 | 相對數字 |
| 有無單位 | 有 | 沒有 |
由於統計是整理數字的方法,能採用相對數字來表達百分比例的權重方式,也就是百分比例愈大,代表權重愈高,所以就能採用「機率」(或稱概率)角度來解釋現象。
當我們取得全體數字後,可利用機率解釋全體數字當中某些特殊數字的出現頻率,常見的有師效率或投資報酬率。若只取得部分數字,則同樣能使用機率解釋部分數字和全體數字的可能關聯性。
以下我們就來看看機率一開始就要知道的機率空間(Probability space)。
1-1 機率空間
所謂機率空間是指對機率產生的一個定義,方便操作與解釋機率所用。
1. 定義
一個實驗所有可能發生現象的集合以(Ω,F,P)表示。(Ω,F,P)是發展機率的規則,我們要先找到Ω,再發展F,最後找到機率。
- 實驗(Experiment)是指一個有興趣的事務即將被探討。探討這個有興趣的事務是以科學角度 - 機率空間 - 進行客觀探索。
- Ω稱為宇集合,是針對一個實驗所有可能出現現象的蒐集。為了方便表達,採取數學的「集合論」方式表現出來。如果當資訊不足時,通常假設每個可能發生現象出現的機會均等。請注意,這是通常假設,非客觀情況。
- F是Ω子集合的集合,在數學上稱為σ-field,也就是封閉式的集合。所以整個機率概念是封閉式集合下進行的。一旦遇到開放式數據,其實不適用於機率。因此,機率的基礎是先蒐集數據,再對「有興趣」的討論對象進行分析。
F也能稱為事件的集合,所以假設一個事件,代號為A,那麼A將屬於F當中。另外,F內共有多少個事件呢呢?答案是2的n(Ω)次方。
- P是機率,來自存在一個A事件且AÎF,得到P(A) = n(A) / n(Ω),且 n →∞。
- n(A)是指A的元素個數。也就是標記A的個數有幾個。
2. 機率的意涵
- 機率代表平均的概念
- 過去經驗中某項特定事件所佔的百分比
- 可做為量測數字,形成相對數字
- 可利用機率對一個未得到的結果進行猜測 (事前概念)
3. 操作過程
以擲一枚公平的硬幣兩次為例,問兩次皆出現同面的機率為何?
(1) 找出宇集合: Ω = {(H,H), (H,T), (T,H), (T,T)}
(2) 確認事件:令A為兩次皆為同面的事件
(3-1) 用集合論解釋: A = {(H,H), (T,T)}
(3-2) 用空間圖解釋:畫出平面空間的兩軸,水平軸代表第一次投擲結果,可能出現H和T,分別列在水平軸上,以符號表示。同樣方式縱軸代表第二次投擲結果,可能出現H和T,同樣列在縱軸上,以符號表示。將滿足A事件的點圈出來。
(4) 算個數:n(Ω) = 4,n(A) = 2
(5)求解 P(A) = 2 / 4 = 1 / 2 = 0.5
4. 樣本空間
將宇空間改為S表示,即為樣本空間。通常先有樣本空間才討論機率空間。
5. 其他
- 主觀機率(Subject probability):刻意用某種集合(指Ω)計算的機率
- 客觀機率(Object probability):以全體現象集合(指Ω)計算的機率
- 古典機率(Classic probability):因Ω未知,造成資訊不足,所以假設討論對象出現的機率相等
- 相對次數(Relative frequency):指全體數據的一部份(指樣本)。因為沒有全體數據,所以採用部分數據所得的機率做表示