描述統計

先把一串數字整理到看得懂

描述統計處理的是已經給你的資料。考試通常不會問得很玄,它會要你算中心、分散,或判斷資料是不是被極端值拉走。

先記這句 平均數看中心,標準差看資料通常離平均數大約多遠。

把資料整理成兩件事:中心在哪,散多開

例如 60, 70, 70, 80, 100。平均數會被 100 拉上去一點,標準差則是在看這組資料大概離平均多遠。

看到這些字,先不要想太遠

  • 題目給一組既有資料。
  • 問平均數、中位數、眾數、全距、變異數、標準差。
  • 沒有信心水準、p-value、重複試驗成功次數。

算標準差前,先確認自己沒有少這幾塊

加總與平均

平均數不是難點,但它是後面每一個離均差的基準。平均算錯,後面會一路歪。

負數與平方

離均差有正有負,直接加會抵消,所以才要平方。這一步不是裝飾。

平方根

變異數平方過,單位不太好懂;開根號後回到原單位,才比較能解釋。

樣本與母體

題目寫樣本就先提醒自己:分母不是 n,是 n - 1。這個很常考也很常錯。

先用 60, 70, 80 看懂離均差

平均數是 70。60 比平均低 10,80 比平均高 10。平方後變成 100, 0, 100,這樣差距才不會互相抵消。

公式先拆成人話,再代數字

平均數 = 全部加總 ÷ 資料個數白話:把所有數字平均分配到每一筆資料。
離均差 = 每個數字 − 平均數白話:每個資料點比平均高多少或低多少。
變異數 = 離均差平方和 ÷ 分母母體分母用 N;樣本分母用 n − 1。
標準差 = √變異數白話:開根號後,單位回到原本的分數、金額或身高。
符號/概念怎麼唸做什麼用為什麼用它
Σ唸「sigma」(大寫,summation)「全部加起來」的記號。資料一多,用一個 Σ 代替「一個一個寫加號」,公式才不會落落長。
唸「x bar」(x 上面一槓)一組資料的平均數。戴一槓代表「這是平均過的 x」,跟單一筆資料的 x 區分開。
n唸「n」樣本有幾筆資料。算平均、算分母都要用到它。
N唸「大 N」母體全部有幾筆資料。大寫 N 專指母體,跟樣本 n 分開,看大小寫就知道在算哪一種。
x − x̄唸「x 減 x bar」,離均差每筆資料比平均高或低多少。要看「分散」,得先知道每筆離中心多遠。
(x − x̄)2唸「…的平方」離均差自己乘自己。離均差有正有負,直接加會互相抵消成 0,平方後全變正,加起來才有意義。
÷ N 或 ÷ (n − 1)唸「除以 N/除以 n 減 1」把平方和平均掉,得到變異數。母體除以 N;樣本除以 n − 1,因為樣本通常會低估分散,減 1 補回來。
唸「根號」開平方,把平方還原回去。變異數的單位是平方過的(例如「分的平方」),開根號才會回到原本看得懂的單位。

右側計算器會把分母和每個離均差攤開

可以先用預設資料看一次,再切成樣本模式。重點是看 n 和 n - 1 對答案的影響。

看資料點離平均有多遠

錯了就看是哪一步歪掉

練題目真的會怎麼寫

考卷上看到一組資料,就照這個順序

  1. 確認題目是整理既有資料,不是推論或分配題。
  2. 先算資料個數與總和。
  3. 算平均數。
  4. 每個數字減平均數,得到離均差。
  5. 離均差平方後加總。
  6. 母體除以 N;樣本除以 n - 1。
  7. 得到變異數,再開根號得到標準差。
  8. 用一句話解讀:資料通常離平均數大約多少。