差異檢定之生物統計策略及基本觀念
生物領域研究常是比較多組間是否有顯著差異 本篇文章介紹使用統計軟體時採用的策略及一定要知道基本觀念 其實要注意的細節很多,但為了要讓大家可以先有個簡單的概念 所以這裡就只以單因子變異數分析(one-way ANOVA)為例 舉例來說就是比較 A、B、C、D 四組動物的採食量之平均值有沒有顯著差異
共 8 篇文章
生物領域研究常是比較多組間是否有顯著差異 本篇文章介紹使用統計軟體時採用的策略及一定要知道基本觀念 其實要注意的細節很多,但為了要讓大家可以先有個簡單的概念 所以這裡就只以單因子變異數分析(one-way ANOVA)為例 舉例來說就是比較 A、B、C、D 四組動物的採食量之平均值有沒有顯著差異
lineA<- c(.70,.80,.65,.78,.62,.67,.78,.61,.76,.64)
lineB<- c(.72,.82,.67,.83,.67,.67,.80,.64,.78,.64)
lineAB<- lineA-lineB #去除各檢定豬場差異
t.test(lineAB)
在 R 執行 SAS 的 glm lsmeans 使用的資料為 R 內建的 dataset- airquality 可以先看一下該資料的描述(紐約某一年的空氣品質指標數據)
資料型態: 幾乎任何資料都可以拿來做資料探索,實務上,當變數數目跟觀測數都夠多時,資料探索的用處比較大。資料探索的目的為處理觀測值之間的交互關係,並將期間模式凸顯給實驗者。
最近接觸到滿多次雙因子變異數分析,想說就記錄一下了解這個統計方法的過程吧
許多情況下,一組觀測值的取值很明顯是取決於另一組觀測值。
本次的案例中每個「個體」都有兩個觀測值。
一個觀測值是「原因變數」、「x 變數」、「預測變數」、「自變數」,
此變數的取值為實驗者的設定或選擇;
另一個觀測值是「效果變數」、「y 變數」、「應變數」,此變數的取值非實驗者設定。
有一系列方式可以判斷原因和效果之間的關係形式和強度,每個方法對變數及其關係的假定各有不同,
這裡考慮五種檢定: 線性回歸、Kendall 最佳配適線、羅吉斯回歸、第二型模式回歸和多項式回歸。
sd<- 1;L<- 0.5*sd
n<-(qnorm(1-0.05/2)^2)*sd^2/L^2
n
dnorm(3, mean = 5, sd= 2)