1 }; q; k% o% p1 Q) X5.39.217.77:8898經過基礎的數據分析,竟然發現港人講地和張志剛均犯上一個非常初級的統計錯誤。主要問題是兩者在處理「中間點」50分數據時,在分組(grouping)上出現錯誤。首先,讀者可以細閱以下港大民研被質疑的民調問題:「而家想請你用0-100分評價你對特首梁振英的支持度,0分代表絕對唔支持,100分代表絕對支持,50分代表一半半,你會畀幾多分梁振英呢?」 # I1 g1 g# g0 o" ]( n 9 N b& e' Y% @; `7 m5.39.217.77:8898以上問題是聚焦於特首的支持度,量度分數是由最低的0分至最高的100分,即是總共有101個潛在得分(0,1,2,3,...98,99,100)。而50分剛好是中間點,但根據問題的措辭,50分只是代表「一半半」,沒有任何暗示這是一個合格的最低門檻。tvb now,tvbnow,bttvb0 {* @! G7 B) e" K9 P
" z, `0 s# T D0 E
關於港人講地和張志剛聲稱,有61.8%的被訪者評特首50分或以上。但經過筆者分析,這所謂61.8%的比例是來自將選擇50分的被訪者納入50分或以上的組別。但筆者可以告訴讀者,這分組步驟已犯上統計錯誤,因為這種方法可能會令到結果出現頗大偏差(Bias)。 ! S2 A# H$ j- y' u9 [TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。 ( \" f% z" w+ W9 T公仔箱論壇以今次民調爭議為例,總評人數是998,包括383人評50分以下,280人評50分,和335人評50分以上。港人講地和張志剛將選擇評分的人分為兩組:0-49分和50-100分。但大家要留意0-49分只有50個選擇分數,而50-100分卻有51個選擇分數,這方法明顯給予50-100分的組別優勢了。但如果我們將分組改為0-50分和51-100分,這又會令0-50分的組別佔有優勢了。總言之,組別的處理方法是可以令到計算組別內的人數出現明顯分別,最終令結果出現偏差。公仔箱論壇) M" U: ]: c, e
公仔箱論壇" D, Z9 s |% q
附表分別採用以上兩種方法去做分組。另外,筆者會使用一個常用的統計方法去處理這分組問題,從而得到一個較客觀和準確的答案。從附表中,讀者可以看到將評50分的人數納入其中一組會帶出截然不同的結論──將0-50分作為一組,即是將評50分的人數納入其中,結果將變為66.4%的被訪者評0-50分,與港人講地和張志剛的38.37%有明顯差距,這正好引證偏差對整個民調的影響。! @5 v6 g# V& ~0 @1 X8 K
: v y5 ~7 ?' S在統計學上,要妥善解決以上的偏差問題非常簡單。只要將一半評50分的人數放至0-50分組別,而另外一半的人數放在50-100分組別。這方法主要是平衡兩個組別的人數,以免出現過份偏差的情況(讀者可以參考ThomasWonnacott和Ronald Wonnacott的"Introductory Statistics For Business and Economics"(Fourth Edition)第二章腳註一)。如果利用這個「平均分配」的方法去處理分組,最終的答案仍是50分或以下的組別佔過半的百分比(52.4%),反映特首的支持度評分不是太理想。' z7 C! y$ y; u3 j1 @% G
' h& y9 m6 L6 l0 f G) W5.39.217.77:8898至於特首的平均分被拖低的問題,筆者同意港人講地和張志剛的論點,但我們分析的角度是有分別。他們認為太多人給予極端評分令到平均分下降是主因。從數學推論,這點是正確。但如果港大民研採用的民調方法是符合統計標準,這些極端評分也是反映香港人的民意。想想如果反對派投訴有太多人給予極高評分於特首,拉高了平均分,我們是否認為極高評分也是極端評分呢?對民意分析員來說,極高和極低的評分也是重要的統計資料。 3 s6 `: t; V$ q, E: B8 o! mtvb now,tvbnow,bttvb公仔箱論壇& ~) D4 |0 n' G" N8 x7 L
但一旦出現很多人選擇極高或極低評分,以平均分來分析民意的變化的確不是一個最好的指標。原因是評分分佈不是一個正態分佈(Normal Distribution)。因此,更好的「中間位指標」可以考慮採用中位數(Median)或眾數(Mode)等統計指標,筆者提議港大民研在發佈民調結果時可以同時公佈中位數和眾數,務求令公眾有更多資料以了解特首的支持度。以這次民調的數據為例,中位數和眾數均是50分,較平均分47.5分只高了2.5分。 " N7 J7 n( q$ b8 k/ Otvb now,tvbnow,bttvb* Y' G& X1 @& o9 i$ J3 R! H0 T: A
另一個處理方法是剔除極高或低評分部份,從而計算「截尾均值」(Trimmed mean)。筆者(關焯照)在中大任教時,也曾負責老師的課程評價(course evaluation)。在報告老師的課程評價時,筆者會同時公佈兩組結果:用所有學生的評分計算平均分和剔除極端評分後的截尾均值,老師可以參考兩組結果從而改善教學技巧。TVBNOW 含有熱門話題,最新最快電視,軟體,遊戲,電影,動漫及日常生活及興趣交流等資訊。: H4 A' R, M+ _
5.39.217.77:8898- C+ j" E1 X% w# E
民調是一個非常有用的統計學方法了解公眾的觀感(gauge public perception),但一旦在計算上出現如港人講地和張志剛等犯上的初級統計錯誤,便很容易得到錯誤的結論,大家應該引以為誡。' [8 m. G% t: h; l* A- p4 P
1 `8 } `& {/ j% a$ b5 b) o% k
tvb now,tvbnow,bttvb. r, A* _! Z" C: z0 C- u
關焯照5.39.217.77:88988 c- i9 o6 F* r% B) A5 U8 s/ L
6 d4 S% T" ?$ h# J3 n/ |$ f" p
經濟學家tvb now,tvbnow,bttvb: P& F, q8 l6 y. \" f' T/ N
冠域商業及經濟研究中心主任* R) Z- p4 d: t9 c1 A& |5 }
C7 `0 S! L( A; @* R" i% T" g
2 C- @) n1 O p; q. j. z C4 ]/ \
周文林3 c- x# @' F1 a0 Z `5 S
公仔箱論壇. G: U6 G% {( `& c. y p
經濟學家 % u1 G& o& c/ T( L- x5 }公仔箱論壇冠域商業及經濟研究中心高級研究員5.39.217.77:8898 Q/ P6 ^8 Y) R& ~
# C k5 m1 L3 I, k% X 6 g2 X7 c' Y/ I# x; c# f雷照盛 ; J y1 X) P8 z' J0 p% h5 t# h統計學家、港大統計及精算學系講師冠域商業及經濟研究中心研究員 3 H' U) s% o% U, X: @- u( n: k7 L公仔箱論壇 ' M* b# G: R* y, K% j; [