管理研究假設檢定 (NHST)的基本大問題,我們的假設是否為Null hypothesis?
20210415 by Prof. Mac Shiau (Wen-Lung Shiau) 蕭文龍教授
管理研究應創造有用且可靠的知識,其中有用的知識需要依賴可靠的知識累積,才能確保管理研究的應用可以真正產生效果。 然而一個研究結果的可靠性,看起來方法嚴謹,但其實它的可靠性是有問題的。 例如Mertens and Recker (2020) 回顧2013-2016 期間AIS Senior Scholars' 8大期刊的引用次數前100篇文章,發現假設檢驗Null Hypothesis Significance Testing(NHST)的重要議題,錯誤使用和錯誤解釋的情形,依舊 存在, 其中有高達83.7%的文章未考慮或討論假設檢驗type II 錯誤的問題。 如同作者 Mertens and Recker所說,我們不是要批評文章,而是透過回顧發現一些問題,提供一些有用的指導原則,讓未來的研究變得更好。
一般假設檢驗 NHST的基本問題,請參考Mertens and Recker (2020)的文章,現在我們討論一個也曾經困擾個人很久的基本大問題:在一般實證研究中,我們的假設是否為Null hypothesis?
什麼是Null hypothesis?
在大學的商業統計課程中,我們總是教導學生作假設檢定時,需要建立虛無假設或零假設(Null hypothesis)和對立假設(Alternative hypothesis),從Lin et al. (2013) 的研究文章中, 可以看出Null hypothesis是檢定是否零(零假設)或沒有差異(no effect)的假設。
例如,
1.點估計,使用t檢定平均數=0
2.多變數相關係數,使用t檢定兩個變數的平均數是否相等(no effect),
3.多元迴歸R平方(從0計算的離差):用F檢定R平方=0
4.多元迴歸R平方的增加:用F檢定新增加的RA,B的平方是否等於RA的平方(no effect)。
當我們的研究提出假設檢驗,並不是虛無假設(零檢驗或no effect沒有差異) 檢驗時,我們不禁回顧,難道我們教導謝學生們提出虛無假設(Null hypothesis)檢驗時,教錯(對)了 嗎?
其實我們只教對了一半,而忽略了另一半,才會產生一知半解的情形,這需要回顧到虛無假設檢驗(零檢驗)的歷史,早期Fisher在1935年提出的虛無假設檢驗(零檢驗), 心理學家先熟悉和接受虛無假設檢驗(零檢驗),教科書和教學都使用Fisher的估計方式,後來Neyman and Pearson 的統計檢驗力分析用來補強虛無假設檢驗(零檢驗)是適當的,到了 1955年Fisher依舊拒絕了Neyman and Pearson所強調的檢驗力分析,因為檢驗力分析難以在虛無假設檢驗(零檢驗)中計算出來(Sedlmeier and Gigerenzer, 1989),也就是在計算型I錯誤(type I error)時,無法估計出型II錯誤(type II error)。 雖然Neyman and Pearson的檢驗力分析都寫入大部分的統計教科書了,然而,大部分的老師在教導提出虛無假設(Null hypothesis)檢驗時,聚焦在避免I錯誤(type I error)時,而忽略 了避免型II錯誤(type II error)。
我們舉例說明如下:
範例1,
我們假設滿意度會正向顯著影響忠誠度
當我們報告迴歸係數是在0.05顯著水準下,滿意度正向顯著忠誠度,為了避免(a) Type I錯誤和決策方便,我們會說明我們的結果是在95% confidence interval信賴水準(信賴區間) 下,迴歸係數為正向的事實,有95%的機會可以觀察到滿意度正向顯著忠誠度的結果。
現在的管理研究(例如,資訊管理)假設中,大量的使用X正向顯著的影響Y,或者是X顯著地關連(associate)Y, 是帶要有方向和顯著性的,這和Null hypothesis 是一致的嗎? 這該如何檢定解釋呢? Lin et al. (2013)在ISR頂刊中提出了相當好的說明,Lin et al. (2013) stated:
“…, The null hypothesis either contains only the nondirectional no effect scenario or it contains both the no effect scenario and the opposite directional scenario….”
Null hypothesis包含了:
A, nondirectional no effect。 非方向(正向或負向)沒有差異(no effect)情境。
或
B, no effect and opposite directional scenario。 兩者沒有差異(no effect)和相反方向情境
我們舉例說明如下:
範例2,
我們假設滿意度會正向顯著影響忠誠度
當我們報告迴歸係數是在0.05顯著水準下,滿意度正向顯著忠誠度,這是說明我們的結果是迴歸係數為0或負向的事實,只有5%的機會可以觀察到這樣的結果。
範例3,
我們假設大學生中,男生比女生更愛玩線上遊戲,這時候,隱喻著Null hypothesis是沒有性別差異(no effect)或是女生比男生更愛玩線上遊戲。
從上述2個範例可以發現,目前我們所建立的假設常常隱喻著是在統計學中談到的對立假設(alternative hypothesis), 因此,正確可靠的對立假設是需要避免(β) Type II錯誤,也 就是需要考慮(1-β), power statistics 統計檢定力(功效),我們建議未來的研究,盡可能在研究設計中,就需要考慮避免Type II錯誤,也考慮報告(1-β)統計檢定力 (功效)。
- Faul, F., Erdfelder, E., Lang, AG. ,and BUCHNER, A. (2007) G*Power 3: A flexible statistical power analysis program for the social, behavioral, and biomedical sciences. Behavior Research Methods 39, 1775 –191 (2007).
- Lin, M., Lucas, H. C., Jr., & Shmueli, G. (2013). Too big to fail: Large samples and the p-value problem. Information Systems Research, 24(4), 906–917. https: //doi.org/10.1287/isre.2013.0480
- Mertens, Willem and Recker, Jan (2020) "New Guidelines for Null Hypothesis Significance Testing in Hypothetico-Deductive IS Research," Journal of the Association for Information Systems: Vol. 21 : Iss. 4 , Article 1. DOI: 10.175 .00629 Available at: https://aisel.aisnet.org/jais/vol21/iss4/1
- Sedlmeier, P., and Gigerenzer, G. (1989). Do studies of statistical power have an effect on the power of studies? Psychological Bulletin, 105, 309-316.
請先 登入 以發表留言。