您的線上調查問卷結果已經出爐。現在,您有了調查結果的統計數據,也定出了資料分析計畫,就可以開始針對收到的調查問卷回覆進行統計分析了。本文將介紹 SurveyMonkey 調查問卷研究科學家分析定量資料 (不同於分析定性資料) 的方式:包括仔細觀察受訪者的回答、以主要的調查問題與調查問卷目標為重,以及從數據中分析出結論。
首先,我們先把重點放在如何計算主要調查問題所得到的結果。您的主要調查問題當中是否包含實證研究問題?您是否考慮進行概率抽樣?還記得嗎?在您設定調查問卷目標的同時,也應該已大致列出主要的調查問題了。
您預計明年還會參加這場會議嗎?
答案選項 | ||
會 | 71% | 852 |
不會 | 18% | 216 |
不一定 | 11% | 132 |
總計 | 1,200 |
請注意這些回覆已經產生了一些百分比 (71%、18%) 和一些原始數據 (852、216)。
這些百分比表示作出特定回答之受訪者的百分比;也就是說,這些百分比表示在所有回答問題的人當中,作出不同回答之受訪者分別各佔多少比例。就此看來,本次調查中有 71% 的受訪者 (1,200 名受訪者當中的 852 名) 計畫明年會再次參加。
這張表格也顯示出有 18% 的受訪者明年不打算再次參加,而有 11% 的受訪者表示還不確定。
還記得嗎?當您在設定調查問卷目標並制訂分析計畫時,曾思考過要把哪些子群組的受訪者拿出來作分析與比較,現在終於要開始執行了。舉例來說,假設您想比較教師、學生及行政人員對「明年是否會再次參加本次會議」這題的回答情況,您必須建立一個交叉比對表,統計每個子群組的回答狀況:
會 | 不會 | 不一定 | 總計 | |
教師 | 80% 320 | 7% 28 | 13% 52 | 400 |
行政人員 | 46% 184 | 40% 160 | 14% 56 | 400 |
學生 | 86% 344 | 8% 32 | 6% 24 | 400 |
受訪者總人數 | 852 | 216 | 132 | 1,200 |
從這份表格可以看出大多數的學生 (86%) 和老師 (80%) 都打算明年繼續參加這個會議,但與會的行政人員則不同,他們當中只有不到一半 (46%) 的人願意再次參加!希望調查問卷中的其他問題能協助您找出箇中原因,瞭解該如何針對行政人員的需求而進行改善,讓他們明年更願意參加。
篩選是數據建模另一項實用的工具。透過篩選,您可將資料範圍縮小到一個特定的子群組,並暫時排除其他子群組。此時,我們就不是在各個子群組之間作比較,而是細看某一個群組如何回答問題。例如,您可將範圍限制在只有女性或只有男性;接著依與會人士的類型重新進行交叉比對,比較女性行政人員、女性教師及女性學生的想法有何不同。當您在篩選、比對和分析結果時,有一件事必須特別注意:您每一次套用篩選條件或製作交叉表時,樣本大小都會減少,為了確保您的分析結果具備統計顯著性,建議您使用樣本數量計算器,計算應該收集多少樣本。
假設您的會議意見調查問卷上有一個關鍵問題是:「整體而言,您對本次會議的滿意度為何?」調查結果顯示,有 75% 的與會者對本次會議感到滿意。這似乎已經相當出色,不過,您可能會希望更深入認識這個數字所代表的意義,並把這個結果與某個基準作比較。比方說,本次會議有辦得比去年好嗎?還是比較差?與其他會議比較起來呢?
假設您在去年會議後的會議意見調查問卷中也問了相同的問題,那麼就應該能進行趨勢比較;套一句老話:「趨勢是你的好朋友。」
如果去年的滿意度是 60%,那表示您今年的滿意度增加了 15 個百分比!為什麼滿意度會增加呢?調查問卷中其他問題的回覆應該能提供一些答案。
如果您沒有去年會議的數據資料,建議您從今年開始,每年持之以恆地收集會後意見。這就稱為基準化分析——建立一個基準數字,往後就能將新的數據與之進行對照,觀察現況如何變化。除了與會者的滿意度之外,您也可以對其他問題基準化分析。如此一來,您就能年復一年追蹤、調查與會者對於會議的想法如何變化,這就叫作縱向資料分析。
您甚至可以追蹤不同子群組的資料。假設學生及教師滿意度每年均有增加,但行政人員的滿意度卻沒有增加,您不妨仔細檢視行政人員對各個問題的回覆,以便找出行政人員滿意度較其他與會者為低的原因。
現在您已經知道有多少人表示會再次參加會議,但您如何確定這些回答真的值得信賴呢?以及您是否能信心十足地參考這些回答做出更完善的決策?注意資料的品質是十分重要的,同時您也要瞭解的統計顯著性的各項組成要素。
「顯著」這個詞通常是表示「重要」或「有意義」;而在調查問卷分析及資料統計的領域中,「顯著」代表的是「準確性的評估」。這也就是為什麼調查數據總是難免需要已「正負」符號來表達,以特別表示調查結果在某個信賴區間當中是準確的,並非巧合。根據不準確的調查結果進行推論是很危險的。在評估統計顯著性時,您首先要考慮的因素是樣本的代表性;也就是實際接受調查的這群人,與您想作出結論的目標群眾在組成上有多「類似」。
如果您收集到的意見調查回覆當中有 90% 份是男性所填寫,但實際上男性只佔總與會人數的 15%,那可就麻煩了。當您對您要研究的群眾認識越深,在看到調查結果符合的相關數據時,您就會信心倍增。至少在這個性別比例的例子當中,如果您的受訪者有 15% 是男性,您對調查結果就會有信心得多。
假設您詢問受訪者參加了整場會議 10 個小組座談會中的幾個,而您得到的結果如下:
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 總計人數 | 平均值 | |
參加的小組座談會數量 | 10% 100 | 0% 0 | 0% 0 | 5% 50 | 10% 100 | 26% 260 | 24% 240 | 19% 190 | 5% 50 | 1% 10 | 1,000 | 6.1 |
建議您針對分析平均值進行分析。別忘了,平均值有三種,分別為平均數、中位數及眾數。
在上方的表格中,參與座談會數量的平均值為 6.1。這裡回報的平均值為平均數,也就是您最熟悉的平均值。要計算平均數,可以將收到的全部數據加總,然後除以這些數據的數量。在這個範例中,有 100 位受訪者參加了 1 個座談會;50 位參加了 4 個座談會;而 100 位參加了 5 個座談會。因此,您將這些數字相乘後加總,並除以與會人數的總數。
中位數則是另一種平均值。中位數代表的是中間值,也就是 50% 的值。在上表中,根據座談會從左排到右的數目,您可將受訪者分為在左側的 500 ,以及在右側的 500 人。以這個例子來說,中位數就是 6 (個座談會)。這個數字可以幫助您排除離群值 (極端值) 對整體資料造成的不良影響。
最後一種平均值是眾數。眾數是指最常見的值。在這個例子當中,最多人回答的值是六。有 260 位受訪者參加了 6 個座談會,比選擇其他任何參加次數的人數都還要多。
如果您的調查結果是以李克特量表來呈現,也能夠使用平均數——以及其他類型的平均值——來進行分析。
當您要報告調查結果時,想想這些數據資料揭示了什麼背景和資訊。
假設您的會議收到的整體評分毫不出色,表現平平,那麼您可以透過其他問題來深入瞭解為何會有這樣的結果。舉例還說,資料可能顯示了與會者對這場會議的各方面幾乎都給予了極高的評價,包括座談會及課程、社交活動及飯店等;但唯獨就對會議所在的城市不滿意。(或許是因為會議地點在芝加哥,又時逢寒冷 1 月,根本不適合出門!) 這就顯示了您的會議辦得很精采,但是地點選得不好。若要在冬天舉辦會議,邁阿密或聖地牙哥可能會是比較好的選擇。
關於資料分析及報告,因果關係及相關性也是您應該思考的面向。
調查問卷資料收集就是利用調查問卷向特定受訪者收集資訊。調查問卷資料收集可取代或補充其他類資料收集方法 (包括面談、焦點小組等) 的不足。利用調查問卷收集到的資料用途很多,包括可以用來提升員工向心力、瞭解消費者行為並改善顧客體驗等。
縱向資料分析 (也稱為「趨勢分析」) 基本上就是追蹤特定因素隨著時間的變化。一旦建立好基準,往後就能判斷數據是否有所變化,以及變化的情形。假設您的會議滿意度在三年前為 50%,兩年前為 55%,去年為 65%,而今年為 75%——恭喜!您會議滿意度正在年年上升!您的縱向資料分析結果顯示了滿意度呈持續上升的趨勢。
因果關係是指兩個因素一個為「因」,一個為「果」,而相關性則是指兩個變數會一起變動,但兩者卻不會互相影響。比如說,喝熱可可和戴毛手套分別為彼此有相關性的兩個變數——當越多人開始喝熱可可,也會有越多人開始戴毛手套;反之亦然。但是,這兩件事不會相互影響。事實上,它們都同樣受制於另一項因素,也就是天氣——當天氣變寒冷,這些行為就會出現。天氣冷會增加熱可可的銷售量,同時也會提高人們戴毛手套的可能性。天氣冷是獨立的變數,而熱可可的銷售量及人們戴毛手套的可能性則是彼此相關的變數。以會議意見調查問卷這個例子來說,天氣冷可能會導致與會者對會議所在城市不滿意,進而影響對會議整體的滿意度。最後,若要進一步瞭解調查問卷中各個變數之間的關係,您必須進行迴歸分析。
迴歸分析是一種進階的資料視覺化及分析方法,可讓您檢視兩個以上的變數之間的關係。迴歸分析有許多類型,而調查問卷科學家會依所要探討的變數來選擇要使用的迴歸分析類型。然而,所有的迴歸分析方法都有一個共同點——它們的目的都是為了探討一或多個自變項對某個依變項的影響。在分析調查問卷資料時,我們可能會想知道影響與會者對會議滿意度的最重大因素為何。是座談會的數量嗎?是主講人嗎?是社交活動的內容嗎?還是場地?透過迴歸分析,調查問卷科學家就能判斷與會者對會議各個面向的滿意度,分別如何影響他們對會議整體的滿意度。
這樣一來,您就能得到重要的見解,告訴您下次應該作什麼改進,讓會議更受歡迎。假設您付了很大一筆費用邀請一流的演講者來主講開場座談,而與會者對這位主講人及會議整體都給出了很高評價。根據這兩項因素,您可能會認為邀請又知名又昂貴的主講人是您會議成功的關鍵,而迴歸分析可以協助您判斷是否果真如此。若您發現,主講人的聲望確實是影響會議滿意度的主要因素,明年您可能會想要再邀請其他有名的主講人。但假設迴歸分析顯示出,雖然所有人都對主講者非常滿意,但這對於與會者對會議整體的滿意度並沒有多大的貢獻。若是如此,您或許應該考慮把這筆高昂的演講費花在其他方面。如果您願意花時間仔細分析您的調查問卷資料是否健全,您將會更明白要如何運用手中的資料做出健全而明智的決策。