統計學家很喜歡去看變異這個東西,變異就是一個變數值的變化,那我們就會想要知道什麼東西造成了變數值的變化,因此,就把變異分解了,我們會根據經驗或是文獻、理論等去想想到底哪些東西可以解釋某的變數的變化,好吧,我們就舉個例子比較清楚,假設你開了一家餐廳,你發現你的店銷售量似乎一值在變動,這個時候你就想要知道到底是什麼因素解釋了銷售量的變動,你想來想去,想到了一個最有可能的理由,就是競爭者的促銷活動,你認為銷售量的變化有很大一部份是歸因於競爭者的促銷活動,可是你又不是神,所以你無法完全命中,也就是銷售量的變動無法完全被競爭者促銷活動解釋,在此情況,你就知道銷售量的變動有些部分是由不知道的因素所解釋。因此,我們可以知道:
總變異=可解釋變異(競爭者的促銷活動)+不可解釋變異(其他不知道的因素) 如果你的可解釋變異那邊放的是類別變數,譬如,競爭對手有無進行促銷活動,那通常這個可解釋變異就被稱為SSTR(Sum of Squares due to Treatment),之所以是稱為Treatment處理是因為實驗設計的傳統,實驗設計下通常可解釋變異會放類別變數,而且是被操弄(處理)的: 情境一: 競爭對手沒有促銷活動 (故意在本餐廳旁邊開了一個攤位,賣的東西和本餐廳類似,假裝是競爭對手,但請他們不要進行促銷活動) 情境二: 競爭對手有促銷活動 (故意在本餐廳旁邊開了一個攤位,賣的東西和本餐廳類似,假裝是競爭對手,但請他們進行促銷活動) 在此情境下,就要用變異數分析,報表中一定會有SST(總變異)、SSTR(歸因於實驗處理的變異)與SSE(不可解釋變異)。 好吧,如果你的可解釋變異那邊放的是連續的變數,譬如,顧客感知競爭者促銷活動的程度,那通常這個可解釋的變異就會被稱為SSR(Sum of Squares due to Regression),也是會有不可解釋的變異,此時要做的分析為回歸分析,報表中一定會有SST(總變異)、SSR(可被自變數的變異)與SSE(不可解釋變異)。 但是,其實回歸分析中的可解釋變異部分,它的變數可以是類別或是連續,因此,變異數分析其實也可以用回歸分析跑,變異數分析是回歸分析的特例,此時可解釋變異就會是SSTR,當然如果你有很多Treatment(處理),SSR=所有SSTR的加總… 其實概念不難,只是計算很機車而已.. 不過我們有SPSS, SAS等軟體幫我們計算,重點還是 我們要懂概念,不然只會計算不懂概念還是沒有用的喔! 好好吸收吧,一起簡單學做的好! 😄😄😄 #簡單學做的好 #鬍鬚曾統計顧問 #基礎統計
0 評論
推論統計的重頭戲就是假設檢定,就是在針對某一個母體的特性去作檢定,譬如說,一家店的顧客平均顧客滿意度分數就是個母體的特性,稱為母數!!
如果你是店長,你就會想要知道這個母數是否大於等於一個特定的值,譬如90分! 假設你擁有顧客名單10000名,因為每一位來你店家消費的顧客你都會先請他們留資料 那你有兩種做法,第一向每位顧客詢問他滿意度的分數,那你就可以算母體平均啦! 第二種,在全部10000位顧客中隨機抽500位顧客,計算其平均分數,此時稱為樣本平均數,用這樣本平均數去推論母體平均數 你當然會喜歡第二種,因為全部都問很累人而且搞不好也會有顧客不想理你的,而且人多就容易出錯 那你就可以知道這500位顧客的滿意度分數,就可以算出樣本平均數,假設是92 還記得我們的問題嗎?是否顧客滿意度平均數>=90 那你一定會想說92>90 所以答案是肯定的 是這樣嗎? 當然不是..因為那個92是樣本平均數,而我們的問題是說母體平均數是否大於90 除非樣本平均數=母體平均數,否則就不對 這種用樣本平均數代表母體平均數的做法,在統計上稱為點估計,因為你是用一個點(樣本值)去估計母數 很明顯,點估計相當危險,除非你是神算章魚哥.. 不然一般而言,會有誤差吧,而這個誤差稱為抽樣誤差 好吧,這樣看來,要針對母數(母體平均數)去做檢定,除了要看樣本的特性外(樣本平均數),還要考慮樣本平均數的抽樣誤差! 沒錯!而這就是假設檢定之精隨了 下一篇文章我們再將這個問題寫成公式吧 一起簡單學 做得好!🤣 |
我是誰鬍鬚曾,政大博士,為人和善客氣,看起來呆呆萌萌的,喜歡分享簡單統計知識,熱心幫助有需要的人,做事認真,常常忘記要照顧自己 查文章
十月 2024
類別 |