上次看到同學在做專題報告時,都會將同意不同意的問題和一個人口統計變數去跑交叉,這到底可以不可以?
首先,交叉分析是針對兩個類別變數去看關聯的,而剛剛同意不同意的問題常常被視為是連續的變數,雖然說將連續視為類別也不是絕對錯(連續可以分解成類別),但是就是有點大材小用了一點,明明可以用更高段的統計分析,卻因為將連續是為類別,現在只能用低等統計分析... 如果這題同意不同的題目是問: 我認為我喜歡這個品牌 同學就會做以下分析: 男生中最多人選同意 女生中對多人選普通 然後有個卡方檢定會說性別與這一題有顯著關聯.. 但是其實,我們可以算出男生的平均與女生的平均,然後透過T檢定去比較是否在母體男生平均與女生平均有顯著差異,這樣我們可以知道更多資訊! 在統計學中,T檢定相當威,而剛剛那個卡方檢定只是個無母數檢定,比較廢..但是因為有時候我們要看的是兩個類別變數是否有關連,我們還是會用卡方,但是如果,其實你有一個變數是連續,一個變數是類別,那你就沒有必要故意耍廢,將連續變成類別,然後用比較不精緻的統計方法..... 所以在剛剛那個問題情境下,我們應該要算兩群人在那個問題的平均數,然後用T檢定去比較,而不是用交叉表...當然,如果現在你有另外一個類別變數叫做職業,然後有很多類別譬如10種,那你就要做變異數分析囉(ANOVA)! 記得不要大材小用..故意耍廢..... 最後來講甚麼時候要用哪一種分析,其實就看你的變數類型是連續還是類別來決定!!! 看兩個類別變數的關聯→用交叉表卡方檢定 一個變數是類別一個是連續,類別是自變數,連續是應變數→用變異數分析(當類別有三群以上)或是獨立樣本T檢定(當類別只有兩群) 一個變數是連續,另外一個也是: 用迴歸或是相關分析! 一起簡單學做得好! 😎😎😎 #簡單學做得好 #基礎統計 #交叉分析 #SPSS #鬍鬚曾統計顧問
0 評論
在講這個議題前,我們就先複習一下交叉表相關的概念!
交叉分析是將兩個變數的值交叉,一邊放欄,一邊放列,其實就可以看出是否一個變數值的分配在另外一個變數下有所不同... 譬如,一個變數是性別,值有兩個,1是男生,2是女生,另外一個變數是最常來這家店的動機,有四個值,1是單純吃飯,2是朋友聚會,3是自修閱讀,4是其他。我們就可以將"性別"與"常來動機"進行交叉分析,比起單純的次數分配,交叉分析提供更細緻的資訊。 如果是次數分配: 可以得知性別中男生有多少人,女生有多少人,還可以知道所有樣本中,男生與女生的占比;又可以得知常來動機那四個分別有幾個人,也可以知道所有樣本中,四個動機的占比!! 如果是交叉分析,我們還可以知道更多!!! 男生中: 四個動機的比例 女生中: 四個動機的比例 也可以反過來, 單純吃飯中,男生與女生的占比 朋友聚會中,男生女生的占比 自修閱讀中,男生與女生的占比 其他中,男生與女生的占比 然後其實這也是個描述統計,其實交叉分析的結果只適用於描述這個樣本,並不能類推到母體,但是很多人都會寫錯... 假設我們現在的母體是所有會去速食店的消費者,那很多人就會根據剛剛那個交叉表的結果說,所以速食業的男性消費者比較會是單純用餐,女性消費者比較會是朋友聚會這種結論... 但是這其實是錯的! 要針對母體做這樣的結論,我們其實是要做假設檢定.... 也就是我們不能只看交叉表看到男生與女生常來動機比例不同,就下這樣的結論...因為我們這只是樣本描述,我們並不是針對母體在描述...所以若要知道是否在母體中男生女生常來動機不同,我們就必須要做"假設檢定",因為假設檢定就是用樣本推論母體.. 在這裡,我們就會用卡方檢定,因為卡方檢定就是看兩個類別變數是否有關連,如果發現有顯著,我們就可以有證據說,速食業的消費者的性別與常來動機有顯著關聯,因此,看常來動機的分配時,就應該男生女生分開看!! 以上樣本與母體的差別,一定要牢牢記住,才不會在寫報告或論文時做出過於誇張的論述!! 下次,我們將分享另外一個學員們常犯的錯誤,將同意不同意的題目做交叉分析! 很多時候,大家都會認為統計就是在玩假設檢定,常常都會直接看所謂的顯著性,大家在做分析時都會想知道有沒有顯著,這也是基礎統計課程或教科書花大部分篇幅在介紹的,但是其實有時候我們是不需要做檢定的。
先複習一下基本概念,之所以要做假設檢定,就是因為我們想要利用已知的樣本特性去推論未知的母體特性! 如果我現在已經知道母體了,那我就沒有做檢定的必要囉。 試想一下情境: 一位老師將全班同學在管理數學上的分數去看是否男生與女生在考試分數之平均數有顯著差異? 這個時候要檢定嗎? 其實是沒有必要的...因為我已經知道全班70位同學的分數拉,那母體就是這70位同學,母體的男生平均數我也可以知道,女生平均數我也知道,這個時候就只要用描述統計直接比較男生與女生的母體平均數就好了啊,不用做檢定! 但是,如果我是要針對某大學所有管理數學的學生為母體,想知道男生與女生平均數是否有顯著差異,這時就需要用假設檢定囉,但是可能要每個班級都抽一些樣本,不能只抽鬍鬚曾老師的班級,不然就沒代表性了。 SPSS統計軟體雖然很貼心但是它並沒有判別的能力,如果使用者不懂統計基本概念的話,就容易犯以上錯誤,這就是為什麼我們還是有必要上統計學理論了解公式與定義,當你了解這些,你在用統計軟體時就比較不會犯錯....不過,很多教科書都艱澀難懂,這也是為啥鬍鬚曾在這裡的原因了,我們就是要你們簡單學概念,操作的好! |
我是誰鬍鬚曾,政大博士,為人和善客氣,看起來呆呆萌萌的,喜歡分享簡單統計知識,熱心幫助有需要的人,做事認真,常常忘記要照顧自己 查文章
十月 2024
類別 |