我們都知道GLM的依變項(反應變數)是接連變數,但McCullagn and Nelder(1989)在其著作提出GedLM來擴充GLM對於反映變數的尺度限制,在GedLM透過「Probability distribution」與「Link function」來將反應變數尺度擴充至連續、類別、挨次、計數(count)等資料型態,以持續依變項則可選擇「Normal distribution」與「Identity Link function」、以二元依變項則可選擇「Binomial distribution」與「Log / Logit Link function」、以計數依變項則可選擇「Poisson distribution」與「Log Link function」等等。因此可知GedLM將GLM擴充至各種反應變數尺度的利用。
在介紹GEE之前,必然要先認識廣義線性模式(Generalized Linear Models翻譯社 鉦昱翻譯公司在本文簡稱為GedLM),其實鉦昱翻譯公司們熟知的一般線性模式(General linear model, GLM)即為GedLM的特例,就好像Multiple linear regression(MLR)為GLM的特例翻譯
第二點是傳統rmANOVA假定各個測量時間點依變項(例如每一個人都有3次資料)的「相幹, σ」不異,這種統計術語叫做「Compound symmetry」工作相幹矩陣,然而在一般套裝統計軟體叫做「Exchangeable」工作相幹矩陣,也就是說研究者假定受試者的每對(pair)時候的依變項相幹係數是一樣的,這個假定在某些景遇是較著不合用的,譬如說一共搜集三次資料且每次都距離一年之久,這時候若再假定第一年與第二年的依變項相關係數(σ12)跟第一年與第三年的依變項相幹係數(σ13)相同,這是很顯著不適當的,因為跟著時候轉變應當(σ12 >σ13),此時可斟酌設定First-order autoregressive(AR1)工作相幹矩陣會比較恰當,AR1是假定若第一次與第二次的依變項相幹係數為σ(譬如0.7),則此時第一次與第三次的依變項相幹係數則為σ2(0.7*0.7=0.49)。如許的工作相幹矩陣(Working correlation matrix)共稀有十種,研究者可合時地先將本身的資料跑各個時候點的相幹矩陣圖,再根據資料型態自行指定合適的工作相關矩陣代入GEE。
但是問題來了,當今天的研究設計是「重複測量」或「鑲套, nested」時,前者比如一個受訪者有3次以上的時候點,後者是每一個大夫負責10-30位病患,此時GedLM雖然仍提供正確的係數估量(estimated coefficient)但卻會供應了錯誤的標準誤(standard error)因此會致使毛病的統計推論,可能會更輕易達光鮮明顯也可能會更難達顯著。(我需要上統計課)
廣義估量方程式(Generalized estimating equation翻譯社 GEE)近五年在國內生物統計範疇(涵蓋醫學、護理領域)颳起一陣旋風,許多Paper及博碩士論文皆大量採用這個統計估計方式翻譯
GEE的較量爭論道理很是堅苦,有興趣的讀者可拜見GEE專書:
Hardin, J. W., & Hilbe翻譯社 J. M. (2003). Generalized estimating equations. Boca Raton : Chapman & Hall/CRC.
可能良多利用者都不知道這個知名統計估量方式實際上是「台灣製造」,是由中研院院士梁賡義(Professor Liang,行將在民國99年擔負陽明大黉舍長)與約翰霍普金斯大學(The Johns Hopkins University)公共衛生學院生物統 計系 傳授Scott Zeger於1986年在兩個頂尖生物統計期刊Biometrika及Biometrics陸續頒發理論與利用文章,以後廣泛地被應用在反複丈量的研究上翻譯
其實以上提到的GEE運用也都以HLM(Generalized Linear Mixed Model / Multilevel Model / Multilevel Regression)或前提式羅吉斯迴歸(Conditional logistic regression, CLR)作替換,但近來研究開始在比力此三種體例(GEE, HLM, CLR)的好壞,今朝以國內而言對照少見到CLR的研究,但已有一些摹擬研究指出在小樣本研究以CLR的模式表現對照幻想。
第一點為沒法容納漏掉值的存在,當有missing data時傳統rmANOVA僅能完全將此受試者的資料刪除(list-wise delete),此時利用GEE不會把missing data刪除,因此儘管受試者k少了某1次資料,GEE照舊可以闡發受試者k的其他次資料。
GEE另一個優勢的地方為強韌標準誤(Robust standard error),簡單來講就是在迴歸方程式的時候由於代入工作相幹矩陣(視為自變項)來估量參數,是以會有殘差(residual),此時受試者內殘差(Within-subject residual)拿來估計標準誤,因此此時的推論結果不限於工作相幹矩陣,因此儘管選擇了不恰當的工作相關矩陣依然能獲得有效的統計推論。
讀者讀到這邊可能會想,為何不直接利用傳統的Repeated measure ANOVA估計便可呢?傳統rmANOVA首要無法解決的問題有二點:
以下文章來自: http://dasanlin888.pixnet.net/blog/post/34468724-%E5%BB%A3%E7%BE%A9%E4%BC%B0%E8%A8%88%E6%96%B9%E7%A8有關各國語文翻譯公證的問題歡迎諮詢鉦昱翻譯公司02-23690937