近來大數據分析很夯,我在學校教書都常常會聽到,現在是大數據時代了,還在教什麼統計學,落伍了!!! 大數據時代下,根本不需要進行傳統統計的推論,因為數據已經很大了,抽樣誤差就會很小,可以忽略,此時實行統計推論的意義性就降低。
就如同你所聽到的,很多人都認為傳統統計會被大數據分析給取代,但是我認為不盡然,首先,傳統統計教的技術很多也是大數據分析的基礎,像是集群分析,還有就是描述性統計還有預測分析,這些也是傳統統計的範圍,在大數據分析時並無消失,只是說要預測要描述的資料變的很多很多!並非每個企業在經營時都會需要龐大數據,對於Google與Facebook這些有海量數據的公司,或許是如此,但規模比較小的企業是否需要? 我覺得,對於我們來說,都要好好學習,以備不時之需阿,鬍鬚曾最近也在學R大數據分析軟體,感覺進到了一個新的世界,但學習就是一件很有趣的事情啊! 就像我一直以來希望你們一起簡單學、做得好,其實我也一直在簡單學做得好! 要一直學習一直進步,才不會被時代所淘汰! 我的觀點是認為這兩種分析是可以互補的,那你的呢?
0 評論
前測是最容易被忽略的問卷發展過程 常常因為時間或成本考量而被忽略,但這是相當重要的階段.. 問卷前測之重要性 用少數的樣本預測未來正式施測可能會面臨到的問題 前測會討論的議題 1. 問哪些問題? 2.用什麼方法做? Protocol: 大聲思考法 當受試者回答完一個問題則立即問他是怎麼回答的了解思考過程,並找出問題。 Debriefing: 事後法 先請受試者填完問卷,後問他們對問卷設計、格式或是個別問題上有沒有問題。 3. 誰做前測? 大部分都是研究者或是研究助理做,但建議可以有些這樣,有些請對研究主題不熟悉的人員來做,但都需要經過訓練讓他們了解前測流程,然後可以比較對研究主題熟悉以及不熟悉的訪員做前測的結果,這樣不但可以得知受試者的問題也可以得知因為不同訪員產生的問題 。 4.前測的對象? 前測的樣本應該要和正式施測的樣本愈類似愈好(典型消費者、代表性),也有人說可以加入一些異質性的樣本。 5. 多少樣本? 12, 20, 30都有,沒有一定,通常因為是前測,所以是小樣本。 pilot study (先遣調查),用一個相對於正式樣本少的樣本來先跑看看統計結果,通常樣本數要60以上。 除了可以針對目標研究對象做前測外,問卷前測很多時候會請3-5位領域專家來看問卷設計與問題。 而且實務上很多時候只會請3-5位目標對象做一下問卷,看看是否有填答上的問題,並根據這些問題進行修正。但事實上,前測做得愈精實,愈能避免之後可能會發生的問題,所以說如果你的研究是要用問卷收資料的話,一定要做前測! 和我們一起簡單學做的好! 參考文獻 Hunt, S. D., Sparkman Jr, R. D., & Wilcox, J. B. (1982). The pretest in survey research: Issues and preliminary findings. Journal of Marketing Research, 19(2), 269-273. 現在有很多線上的問卷平台,好用的無非是Surveycake(調查蛋糕)或是Google表單,使用這些就能讓你快速的架設問卷並收集資料,增加資料收集之效率⭕
很多倡導大數據的人都覺得統計學落伍了,但其實卻不知道統計學其實是大數據的基本功。他們常常會說大數據的資料很龐大,這已經不是一般統計軟體可以處理的。
這點沒有錯,但這不代表統計學已經落伍或是沒有用😉 第一、並不是每個情況都會是需要用到大數據的,對於亞馬遜或是google等每天都有超多人使用的網站,上面就會產生很多數據,就會需要用到大數據。但對於一般小公司,不太可能會有這麼多的數據可以使用,這時候一般的統計分析就夠用了🙆 第二、統計學的技術為大數據分析提供基礎。迴歸分析、關聯分析為大數據演算法提供一些基礎,發展更細緻的預測模型✨ 大數據雖然是現在很夯的名詞,很多人都說人人都要學,這個時候我們還是要提醒自己一下,我們不一定也要跟著學,除非我們有很多數據! 簡單學做得好!👍 #基礎統計 #鬍鬚曾統計顧問 #統計學懶人包 #統計顧問 #大數據 實務界重視的就是快速找到解決之道並執行之,學術界則是用比較嚴謹的方式求答案。
複選題可以快速得知大部分的受試者之共識🙋♀️🙋♂️ 譬如,消費者對漢堡口味的偏愛做複選題分析,他就可以告訴我:一般來說,受試者會平均選三個選項,第一是大堡堡,第二名是起士堡,第三名是魚堡,那這三種就是主力產品,然後就能針對這些產品極力宣傳✨ 其實,我們也可以分別針對這些口味去測量顧客偏愛程度,然後進行平均數的檢定,找出最高平均數的口味;但實務業者很少這樣做,因為很浪費時間,且顧客要填很多題目😕 但若使用複選題,就不能做統計檢定,讓結果比較沒那麼客觀與嚴謹。 所以,實務界因複選題的效率性愛上了複選題,學術界則因為複選題無法進行統計檢定所以不怎麼愛🙏 你想知道複選題怎麼編碼嗎?你想知道複選題要做什麼分析嗎? 立即點選下面連結學更多!👍 https://www.facebook.com/wushistatistis/videos/413141762853574/ #統計學懶人包 #基礎統計 #統計基礎 #統計懶人包 #鬍鬚曾統計顧問 #簡單學做的好 迴歸分析有一目的在於預測,也就是用自變數的值去預測應變數的平均。
譬如說,我們問每問同學的讀書時間(天)並記錄每位同學在管理數學的考試成績,樣本有50位(隨機從全校管理數學課程班級中去抽樣)📝 那假設我們發展出來的樣本迴歸模式是 yhat=10+3x,我就會想要用這個式子去預測,若讀書時間為24天那預測的平均成績就是10+3*24=82,真的是這樣嗎?😵 如果我們發展迴歸式時所用的自變數範圍只有1-10,請問代入24合理嗎?這叫做迴歸模式的extrapolation(外插),這有什麼危險?⚠️ 會不會當自變數超過10,迴歸模式已經不是直線了呢? 如果是這樣,那你外插就不準了。❌ 記住,迴歸模式在自變數值範圍內預測(interpolation)是比較安全的,超過範圍就危險囉 (extrapolation)! 一起簡單學做的好!👍 #統計學懶人包 #基礎統計 #統計基礎 #統計懶人包 #鬍鬚曾統計顧問 #簡單學做的好 |
我是誰鬍鬚曾,政大博士,為人和善客氣,看起來呆呆萌萌的,喜歡分享簡單統計知識,熱心幫助有需要的人,做事認真,常常忘記要照顧自己 查文章
十月 2024
類別 |