P值其實是機率的概念,他是假設檢定的專有名詞! 假設檢定中,我們會有虛無假設與對立假設,虛無假設通常是放無效果的假設,而對立假設會放有效果的假設。在這樣的假設下,我們去抽取一個樣本,根據樣本算出一些值來看看這個樣本推翻虛無假設的強度有多強? 也就是p值!
P值其實是”證據強度”,當p值發生機率小於0.05,表示我找到了一個發生機率很低的證據(我的樣本),這種證據通常就是很強的證據可以推翻原先的假設,因為發生機率低,或是說,雖然我的虛無假設假定無差異,但是樣本告訴我們差異很大,表示原先的虛無假定可以被推翻,因此就接受對立假定的”有差異”結論。 至於p值為何要低於0.05,這個就是統計學家的共識! 他們認為證據發生的機率要低於0.05才算是一個可接受的強烈證據,當然如果你要嚴格一點,妳可以訂要低於0.01甚或是0.001,如果要寬鬆點就是訂0.10。
0 評論
統計檢定就是用樣本特性推論母體特性,如果現在你已經有了母體,那就不用再進行假設檢定囉!
這個時候報導p值或是假設檢定的結果,都是沒有意義的。而很多統計軟體預設都會報導假設檢定的結果,但你現在知道了,當你已經掌握母體的資訊,那你就不用看假設檢定或是P值了! 記得不要再犯檢定病了! 也不要過於相信統計軟體的預設喔! 點了解p值更多 如果你認為統計學就是在搞分析,那你很有可能會得到沒有意義的結果!!!
如果資料沒有品質、衡量很爛,分析再好也沒有用,因為垃圾的資料,再怎麼分析,也只是產生垃圾的結果而已!! 當你執行一個數字專案或是研究時,記得,你要專注的問題並不只只是統計分析的問題而已,還有很多其他的問題,以下我提供一個Checklist給你參考! 之後我們的統計學懶人包就會一一回答這些問題喔! 一起和我簡單學,做的好! 很多倡導大數據的人都覺得統計學落伍了,但其實卻不知道統計學其實是大數據的基本功。他們常常會說大數據的資料很龐大,這已經不是一般統計軟體可以處理的。
這點沒有錯,但這不代表統計學已經落伍或是沒有用😉 第一、並不是每個情況都會是需要用到大數據的,對於亞馬遜或是google等每天都有超多人使用的網站,上面就會產生很多數據,就會需要用到大數據。但對於一般小公司,不太可能會有這麼多的數據可以使用,這時候一般的統計分析就夠用了🙆 第二、統計學的技術為大數據分析提供基礎。迴歸分析、關聯分析為大數據演算法提供一些基礎,發展更細緻的預測模型✨ 大數據雖然是現在很夯的名詞,很多人都說人人都要學,這個時候我們還是要提醒自己一下,我們不一定也要跟著學,除非我們有很多數據! 簡單學做得好!👍 #基礎統計 #鬍鬚曾統計顧問 #統計學懶人包 #統計顧問 #大數據 Spss在使用的時候都很貼心,很多預設的分析都幫你用好了,你只要點一點就可跑出結果。但你有沒有想過,這些預設是對的嗎?😧
因素分析這個統計技術他有兩種目的,第一種就是資料縮減,用少數的變數代表很多變數;第二種就是資料的彙整,也就是找出使變數產生相關背後的一組因素。 當我們跑因素分析的時候,spss或sas等統計軟體他們會預設因素的轉軸用直交轉軸法,這樣真的是合理嗎?🤔 直交轉軸產生出來的因素彼此之間是獨立的,可是因素真的那麼獨立嗎?我們可以將行銷變數分為產品、價格、通路與推廣四種因素,但往往這四個彼此之間必須要有搭配才能發揮好的效果。如果產品、價格、通路與推廣各說各話,那行銷效果一定很差❌ 所以,假定因素之間是有關的斜交轉軸似乎比較符合現實。 其他的例子還有因素分析在決定因素要取幾個時用的方法是預設為k1法則,而這個法則經過模擬研究的結果發現是劣於其他準則。其他還有很多例子,那就以後再說吧✨ 記住,不要太相信統計軟體的預設,不然你就會跑出一個不切實際的結果🤦♂️ #統計學懶人包 #基礎統計 #統計基礎 #統計懶人包 #鬍鬚曾統計顧問 #簡單學做的好 推論統計又分為有母數與無母數統計,為什麼統計學有媽媽沒媽媽?🤶
這其實和有沒有媽媽無關,有母數與無母數統計區分的依據就是…… 是否假設母體為常態分配,有母數統計假設母體為常態,無母數就沒這樣假定。 這樣看來,好像無母數統計比較自由,有母數就比較受限是吧? 那我幹嘛還要讓自己受限呢?😵 其實,我們常用的統計分析技術,像是t檢定、f檢定、迴歸分析等大多都是在假定母體為常態分配的情況下去做的,如果這個假定沒有滿足,我們就無法享受這些檢定與分析帶來的強大特性😳 如果母體不是常態分配,你硬用有母數統計就不太行! 當母體是常態分配,你用無母數統計就會容易得到不顯著的結果(檢定力降低)。 🙅 所以,當母體為常態分配時,用有母數統計去做;當母體不是常態或你不知道分配是啥時,用無母數統計! 一起簡單學做的好!👍 #基礎統計 #統計基礎 #統計懶人包 #鬍鬚曾統計顧問 #簡單學做的好 量表是很多問題組成的,通常是用來衡量一個概念,像是忠誠度,要衡量這個概念,我們會用譬如三題去衡量
1. 我願意推薦別人來這裡消費 2. 我未來會願意繼續消費 3. 即使競爭對手比較便宜我還是願意在這裡消費 其實我們也可以用量表將人們分類喔,而這個時候,這些量表衡量的概念應該是反映個人差異(Individual Differences)的特質,像是宅與萌,雖然這兩個概念的定義很不清楚,但是因為比較有趣,所以我就用這兩個概念當例子。 當我要衡量一個人的宅與萌程度,到底要怎麼量? 首先我就從過去文獻中找找看是否有人使用過衡量這兩個概念的量表,如果我有幸找到了(若找不到就要自行發展量表,這個複雜,以後再說),我就會用這些量表去衡量宅與萌。 假設宅與萌分別用五題衡量,請填答者針對每題勾選其同意程度,那每位填答者就會有十個分數,我們就可以算出每位填答者在宅與萌的分數,宅的分數就是五題問題的平均數,萌的分數也是五題問題的平均數,那接下來我們就可以將填答者分類了! 問題是要怎麼分? 答案就是用中位數或是平均數去分。 當填答者在宅的分數高於中位數(平均數),則被歸類為”高宅”;低於中位數(平均數)則是”低宅”;當剛剛好等於中位數(平均數),則會刪除。 萌那邊也是類似的作法。 但是我們怎麼知道區分是有效的? 答案就是用兩獨立樣本t檢定。 我們會比較是否”高宅”與”低宅”這兩群人是否在”宅分數”有顯著差異,高宅是否顯著高於低宅的宅分數 萌那邊也是要做。 如果都顯著,表示歸類成功 那你就可以知道每一個填答者可以被歸到哪一類,也可以知道鬍鬚曾是否如同同學所說,是被歸類到宅萌類,也就是高宅值高萌值,就是宅萌! 有個細節,就是什麼時候要用平均數,什麼時候要用中位數作為歸類的基礎? 這容我之後再說吧! 一起簡單學做的好! #鬍鬚曾統計顧問 #基礎統計 #研究運用 #研究方法 |
我是誰鬍鬚曾,政大博士,為人和善客氣,看起來呆呆萌萌的,喜歡分享簡單統計知識,熱心幫助有需要的人,做事認真,常常忘記要照顧自己 查文章
十月 2024
類別 |