兩個數字的不同人人都看的出來,但要知道兩者之間的差異是否具有統計顯著性,就必須得多做一點功課了。
舉個例子,假設您為公司進行了客戶滿意度調查,現在收集到一大堆的回覆要分析,而公司老闆說他想先知道男性和女性的滿意度有何不同,例如男性給的 Net Promoter Score℠ (淨推薦分數;NPS) 是否高於女性給的分數?
深入研究您的資料以後,您發現男性給的平均分數是 9,而女性給的平均分數是 12,您要怎麼知道這個 9 和 12 是否有顯著差異?這就要靠 t 檢定來計算了。
t 檢定是驗證兩個數字之間是否具有顯著差異的一種方法,它有幾種不同類型,每一種都有專屬的計算公式。
1. 單樣本 t 檢定:檢驗一個群組的測量值平均數 (以這個例子來說就是淨推薦分數) 是否與您指定的值不同。
例如:貴公司的目標是要讓淨推薦分數 (NPS) 顯著高於業界標準的 5 分,而最近一次的調查顯示,貴公司的 NPS 是 10 分——這個 10 分與 5 分是否具有顯著差異?
2. 雙樣本 t 檢定:檢驗兩個群組的測量值平均數彼此之間是否有顯著差異。
例如:您假設男性給貴公司的 NPS 比女性給的還要低,結果調查顯示男性受訪者平均給了 9 分,而女性受訪者平均給了 12 分,請問這個 9 分與 12 分是否有顯著差異?
3. 成對 t 檢定:檢驗同一群組的兩次測量值的平均是否有顯著差異,也就是第一次和第二次測量獲得的平均值是否不同。
例如:您對同一群客戶進行了兩次調查,一次在四月,一次在五月。貴公司在兩次調查期間推出了新的廣告,您想知道的是:客戶給您的 NPS 在廣告推出前後是否有改變?
請注意,t 檢定固然能告訴您兩數字在統計上是否具有顯著差異,至於該差異對您來說是否有實際意義,還是必須由您自行判定。在樣本數量夠大的情況下,微小的差異可能也會具有統計顯著性。
t 檢定的 4 個步驟:
1. 計算 t 檢定統計量:
每一種 t 檢定計算檢定統計量的方式都不同。您可以到本頁後面列有三種不同的計算公式。
2. 計算自由度:
自由度指的是在構成平均值的樣本當中,可以自由變化的數據的個數。以這個例子來說,自由度就是您從特定一群受訪者收集到的淨推薦分數的數量。自由度與 t 檢定統計量一樣,它的計算公式會根據不同的 t 檢定類型而有異。
3. 決定臨界值:
臨界值是用來判斷兩數字是否有顯著差異的閾值。
4. 比較 t 檢定統計量和臨界值的絕對值:
如果 t 檢定統計量大於臨界值,差異就算顯著;反之,如果 t 檢定統計量小於臨界值,您要比較的兩個數字在統計學上就不算有差異。
讓我們再回頭來看一開始的例子:您的假設是「男性給貴公司的 NPS 比女性給的還要低」。調查顯示男性受訪者給平均給了 9 分,而女性受訪者平均給了 12 分,這個 9 分與 12 分有顯著差異嗎?要計算這題,我們必須使用雙樣本 t 檢定。
1. 計算 t 檢定統計量:
使用雙樣本 t 檢定的公式,其中:
2. 計算自由度:
雙樣本 t 檢定中的自由度計算公式如下。其他類檢定的公式列在後面的段落中。
3. 決定臨界值:
根據本表,某雙側檢定若 α 水準為 0.05 且自由度為 41,其臨界值為 2.02。請記得,大多數的分析師會使用雙側檢定而不是單側檢定,因為雙側檢定較為保守 (比較不容易顯著)。若要深入瞭解單側和雙側檢定的差別,請看這部 Khan Academy 的影片。
4. 比較 t 檢定統計量和臨界值的絕對值:
現在我們知道 t 檢定統計量的絕對值是 0.86,比臨界值 2.02 還小,因此男性受訪者給貴公司的 NPS 並沒有顯著地比女性受訪者所給的還要低。
您大概會利用 Excel 試算表或 SPSS 之類的統計分析軟體進行 t 檢定,但如果您想要自己手動計算,另外兩種 t 檢定的公式如下。
如果您決定像大部分的人一樣,用試算表或統計分析軟體執行 t 檢定,計算過程可能會略有不同。大部分的統計分析軟體會計算 p 值,然後拿它來與 α 水準 (通常是 0.05) 作比較 (而不是計算 t 檢定統計量,然後與臨界值做比較)。在這種情況下,當 p 值小於α 水準,就表示您要比較的兩數值有顯著差異。
淨推薦分數 (Net Promoter Score) 是 Bain & Company, Inc.、Satmetrix Systems, Inc. 及 Fred Reichheld. 的商標。
探索我們專為特定角色或產業設計的眾多工具組,幫助您善加利用意見回饋。
在離職面談中詢問合適的問題,以減少員工流失。立即開始使用我們的員工表單建立器工具和範本。
透過自訂同意表單,取得所需的權限。立即免費註冊,開始使用我們的同意表單範本建立表單。
輕鬆建立和自訂專屬的請求表單,以收集員工、客戶及其他對象的要求或申請。使用專家建立的範本,幾分鐘就能完成。