通往線性代數的聖母峰 : 特徵值分解(EVD)、奇異值分解(SVD) 與主成分分析(PCA)

聖母峰的譬喻很有趣,原文來自交大周志成老師的線代啟示錄部落格,周老師文章裡曾說線代領域有兩座聖母峰,一座叫Jordan Form用來判斷矩陣相似問題,另一座就是奇異值分解(SVD,Singular Value Decomposition)。 特徵值( Eigenvalue )、奇… Continue Reading

統計R語言實作筆記系列 – 2D視覺化進階 ggplot()的基本架構(一)

R 世界的諸多套件當中,有兩個高級繪圖套件非常受到歡迎,分別是「 lattice 」與「 ggplot2 」。 和 R 內建的圖形函數相比,兩者都納入更多子功能可以繪製複雜的圖形,不過作圖的基本原理並不相同,其中 lattice 除了 2D 繪圖之外,還能繪製 3D 圖形,但就美… Continue Reading

統計R語言實作筆記系列- 直線abline()、曲線curve()與多邊形polygon()視覺化繪圖

最近的文章中提過如何用 R 產出基本的統計圖表,也示範過用 abline() 函數繪製輔助線,但假如想要加上各種經典曲線在圖形中方便比較差異,或者隨心所欲地繪製自定義的曲線,那麼這篇文章將要介紹的函數 curve() 就能幫上忙。 輔助線之外,適當地繪製面積也是一種替圖表增色的方… Continue Reading

統計R語言實作筆記系列 – 2D資料視覺化入門

R的繪圖套件相當豐富,在「R Graphical Manual」網站上有不少範例可供學習,一般的2D統計圖表自然不在話下,還可以輕易繪製出工程上常用到的3D圖形。此外,R還包含了一些特殊的繪圖功能,像是自訂函數、繪製世界地圖資料、互動式圖表、把圖表輸出到網頁上等等。R的社群經常喜… Continue Reading

統計R語言實作筆記系列 – 資料尺度與變數類型

收集原始資料是統計的必要步驟,前一篇介紹過把資料輸入到 R 的方法,但是在收齊資料到執行統計分析之前,還有一些基本的要件必須定義清楚,例如資料的統計尺度為何,一般常見分為四種: 比例(ratio)、區間(interval)、順序(order)、類別(nominal),依據尺度不同… Continue Reading

隨機性、大數法則與中央極限定理

常態分佈(Normal Distribution)搭配中央極限定裡(CLT,Central Limit Theorem)的概念,大概是統計學裡應用最廣泛的組合了,不過,也是最常被「一知半解」的對象。 但是從「隨機性」的角度來看,幾乎是不可避免的必然。 大數法則與經典的丟硬幣機率問… Continue Reading

主成分分析(Principal Component Analysis)與因素分析(Factor Analysis)

許老師上研究方法的時候說,很多人的論文都會用 survey,所以因素分析( FA,Factor Analysis )很重要。我有時候也會被問到一些相關的問題,趁著空檔整理拼湊一下至今所學。 劈頭而來的困惑是,為什麼問卷很常用所謂主成分分析( PCA , Principal Com… Continue Reading

廣義線性模型觀點:統計迴歸分析(Regression)的基本原理與結構

差不多 2 月左右,衝假的緣故休得特別多,又正好碰到統計上無法解決的問題,於是本人也很有野心的列了一張清單,幾月的時候要看完哪些書目、做點小研究、整理一些心得什麼的,不過就像許多人每年的「夢想板」,寫爽的成分比較多…,趁著空檔,終於趕在開工前夕把 ptt 上也常有推薦… Continue Reading

卡方檢定 Beyond The Cross :三維列聯表分析( Three-way Table )與辛普森悖論( Simpson’s Paradox )

一連寫了兩篇《卡方分配與卡方檢定》、《卡方檢定 On the Cross:Pearson, Yates and Fisher》,分別描述了從 2 x 2 到 R x C 的大樣本表格檢定,也陸續討論了小樣本情境的修正公式、費雪精確檢定( Fisher’s Exact Test )… Continue Reading