資料玩家人人必備! 5 分鐘快速部署你的第一支 R Shiny 互動式圖表網頁APP

打從 2012 年下半首次亮相開始,在玩 R 的資料科學社群當中,出現了一個人人都在談論、場場都在介紹的套件:Shiny 。這個由 R 相關的新創團隊 R Studio 所開發的套件,如今在許多企業( 最近就聽說過包括 ebay 在內的幾間知名廠商)的內部研究專案中都扮演著 prototype 生產器的重要角色。 Shiny 到底是做什麼的?為什麼可以讓許多使用者趨之若鶩?

產業百百種,哪個最熱門?哪個薪水高?最新就業分析帶你一探究竟 (四)

職業的性別比較一向是人力資源學者及職場作家的最愛,從薪資、偏好和工作價值觀等方面入手,往往能引起廣泛討論,在本系列的最後一篇文章中,就以實際的數字來看看,究竟普遍流傳的職場刻板印象(例如:相同職業下,男性收入大於女性)是否為真? 男性的職業偏好 統計數字再次強化了台灣作為製造業王國的刻板印象,製造業以壓倒性的人數差距榮登最多男性投入的業別(難望其項背的 150 萬人),次多的則是批發及零售業的 74 萬人以及營造業的 37 萬人。 假如你熟悉產業轉型的觀念,那麼一定經常在各種場合看到這個統計數字「台灣的服務業佔 7 成」,因此服務業是王道,而且台灣已經是服務業很成熟的國家。 筆者並不駁斥上述關於服務的趨勢,但仍然忍不住要對政府、學界經常灌輸給大眾的「不合宜觀念」潑一點冷水,在幾年前筆者曾寫過一篇文章《左右為難的製造與服務》,當中指出從經濟成長率的支柱角度來看,製造業在台灣更為重要,這個觀點不僅至今還沒有逆轉,從就業實況來看更是一面倒的以製造業居多。 那麼所謂的「服務業 7 成」這樣的數字何來?許多名義上變成製造服務業的公司,只是玩玩文字遊戲,說著專業製造也是服務的一種,然而不管在投資、商業模式及文化制度方面,依舊是原本的那個製造業思維。 轉型有道的企業有沒有?有的,但還是遠遠不夠多到能心安理得的冠上服務王國的稱號。 所謂製造業其實包羅萬象,主計處的子分類如下: 食品製造業  飲料及菸草製造業  紡織業  成衣及服飾品製造業  皮革、毛皮及其製品製造業  木竹製品製造業  紙漿、紙及紙製品製造業  印刷及資料儲存媒體複製業  石油及煤製品製造業  化學材料製造業  化學製品製造業  藥品及醫用化學製品製造業  橡膠製品製造業  塑膠製品製造業  非金屬礦物製品製造業  基本金屬製造業  金屬製品製造業  電子零組件製造業  電腦、電子產品及光學製品製造業  電力設備製造業  機械設備製造業  汽車及其零件製造業  其他運輸工具及其零件製造業  家具製造業  其他製造業  產業用機械設備維修及安裝業  女性的職業偏好 製造業為王的就業現象,在女性身上是否也一樣呢?根據統計,即使是對女性而言,各種製造業依舊吸收了絕大部分的就業勞動力。 排名前兩位最多人的工作業別和男性並無二致,值得注意的是女性參與營造業的人數很低(男性則是人數第三多的工作),而在醫療保健服務業等業別上工作選擇顯得較平均許多。 附帶一提,國內年平均將近 700 萬的勞動人口中,男性比女性多了約… Continue Reading

產業百百種,哪個最熱門?哪個薪水高?最新就業分析帶你一探究竟 (三)

在本系列的第一篇及第二篇文章當中,討論過近幾年各產業的「從業人數」、「薪資」與「工時」的趨勢變化,在這篇文章當中,將以產業人力「進入」及「退出」的角度來探討行業別之間的差異。 哪個產業人人搶著進去? 來看看下面這組表格: 從 2010 ~ 2013 年間,有四個產業的平均進入指數超過了 4.0,排行首位的是「支援服務業」這點相當有意思,在上一篇文章已經指出,支援服務業實際上是工時頗長的一個行業(平均每月工時 191.2 小時),但是報酬則是一般般(平均月薪 3.3 萬),何以還有許多人搶著要加入呢? 合理推測,由於支援服務業的進入門檻較低,所以人員的流動率也較高,製造了熱門的假象,這一點稍後的退場率分析當中可以來做個比較。 其餘三個看似異常熱門的產業則包括:「住宿及餐飲業」、「運動、娛樂及休閒服務業」及「藝術、娛樂及休閒服務業」,似乎都有著門檻低而職業生命有限的通點。 哪個產業人人搶著換跑道? 繼續看到退場率的部分: 一如預期,退場率最高的行業正好就是最多人進入的「支援服務業」、「住宿及餐飲業」、「運動、娛樂及休閒服務業」及「藝術、娛樂及休閒服務業」四個行業,可見得熱門行業的光環背後,往往都有著流動率高的隱憂,很多人在從事的工作並非最理想的那個,這一點許多新人還未正式踏入職場時經常會有這樣的誤解,好像總是要找到一個每個人都知道在做什麼的職業才不會好像很沒面子,其實最賺錢的行業都是那些低調的沉默少數。 結合進入指數與退場指數的觀點,可以找到有幾個產業的流動性是特別低的,包括了:「電力及燃氣供應業(進入指數 0.4 ; 退場指數 0.4 )」、「礦業及土石採取業(進入指數 1.1 ; 退場指數 1.4)」、「金融及保險業(進入指數 1.5 ; 退場指數 1.4)」、「醫療保健服務業(進入指數 1.6 ; 退場指數 1.3)」,我們可以理解為這些產業相對穩定,而且人員的汰換率相較於其他產業偏低,反之也暗示著產業結構僵固,職場平均年齡估計也是偏高的。 哪個產業的人力失衡最嚴重?哪個產業現在正是進入好時機? 綜合以上數據,還可以再計算出哪個產業的進入與退場人數失衡得最嚴重,也就是供過於求或者供不應求的現象,彙整如下表: 從表中可以發現,一共有三個產業的人員增長是負值,有「美髮及美容美體業( -0.27 )」、「礦業及土石業( -0.25 )」、「運動、娛樂及休閒服務業」。 美髮及美容美體業方面,在前兩篇文章中提供了佐證資料,從職員角度來看,不管是薪資和工時方面都是墊底之選,招不到新人也就不奇怪了。 一份數據兩樣情,礦業及土石業的些微衰退對於新人來說卻是值得關注的好消息,除了擁有不錯的平均月薪( 4.7 萬)之外,每月平均工時也僅是普通水準的 180 小時。 運動、娛樂及休閒服務業的表現就差了一點,提供給勞動者的條件是每月平均… Continue Reading

產業百百種,哪個最熱門?哪個薪水高?最新就業分析帶你一探究竟 (二)

延續上一篇文章的分析,我們繼續來探討,不同產業之間的就業情況及薪資有什麼不一樣。 哪個產業薪資高?哪些產業薪資最有成長空間? 雖然隨著科技股票分紅費用化的政策,所謂的科技新貴早已成為歷史名詞,但科技業高薪的刻板印象則普遍烙印在大眾腦海當中。 這麼說,難道這個觀念不正確嗎?其實,跟所有產業比較起來,頗能代表科技印象的「資訊及通訊傳播業」薪資雖然不算差,但說到第一名,可能跌破很多人眼睛,21 個產業的榜首竟然是很少會在薪資討論中被談及的「電力及燃氣供應業」,平均月薪高達 8.5 萬,再來才是大家熟悉的「金融保險業」以及「醫療保健服務業」,分別以平均月薪 7.8 萬以及 7.3 萬居次。 說到電力燃氣業,除了少數綠能相關的外商,絕大部分從業人員都跟台電、民營發電廠有關,這麼高的平均薪資對照相對廉價的台灣電力價格不僅反映出政府產業政策的畸形,更讓人忍不住開始過度聯想…,這裡面到底藏了多少肥貓啊? 21 個產業的薪資比較表詳見下圖: 但是如果從薪資前景的角度來看,則又是另外一種風景了,原先排名第一的「電力及燃氣供應業」在過去 4 年當中節節衰退,與 2010 年時相比,2013 年的薪資足足減少了 8%,是所有產業衰退最嚴重的。 薪資成長最好的三個產業,都有著經濟成長率 2~2.5 倍以上的表現,與 2010 年時相比,漲幅達到 9.3%~9.9%,包括了「藝術、娛樂與休閒服務業」、「住宿及餐飲業」以及「運動、娛樂以及休閒服務業」,可見得在注重生活品質的台灣,生活經濟不僅只是「感覺」,已經實質反映在就業人數的增加以及薪資的提高,這對於產業服務升級而言自然是很好的訊號。 只不過,三個薪資成長快速的產業在平均月薪方面仍是偏低,尤其是「住宿及餐飲業」僅有平均 2.9 萬的水準,反映出高素質人力的價值並未充分體現在產業加值上,促使企業一味追求廉價的勞力,或許現在已經來到反轉的階段:由於企業對人力品質的要求提升,在現有薪資水準下又很難招募到足適的人力,進而實現了過去幾年薪資的快速成長。 哪個產業最操勞?哪個產業越來越沒事做? 還有一個大家也很關心的議題是:哪個產業的工時最長?對於在薪資成長普遍停滯不前的大環境下,轉而重視生活品質的國人而言,這是一個基本卻越來越重要的問題。 根據圖表,大部分產業的每月平均工時並沒有非常顯著的差別,但最高與最低仍然有一段差距,尤其是在本系列首篇文章「就業人數」的成長率排行中已經接近墊底(在 21 個產業中倒數第二,累計人數 -7.4 %)的「美髮及美容美體業」再次上榜,以平均 213.9 小時遙遙領先,可說是最操勞的行業,或許正是因為如此而導致新人投入的意願逐年下降,造成找不到人只好增加現有員工工時的惡性循環。 「其他個人服務業」則以平均每月 193.6 小時排名第二,自己接案當老闆畢竟心力會花得比較多,並不讓人意外,排名第三的則是「支援服務業」,平均每月工時達到 191.2 小時。什麼是「支援服務業」?它們其實就是: 租賃業 人力仲介及供應業 旅行及相關代訂服務業 保全及私家偵探服務業 建築物及綠化服務業 業務及辦公室支援服務業… Continue Reading

產業百百種,哪個最熱門?哪個薪水高?最新就業分析帶你一探究竟 (一)

最近在網路上看到這篇熱烈討論的「[爆卦] 月薪七萬元以上人數統計」,秉持著眼見為憑的研究精神試著找原始資料來看一看,卻誤打誤撞在主計處統計資料裡碰到另外一個有趣的議題:各產業的就業薪資、工作時間以及人員的進退場比率之間有什麼關係? 從這個主命題延伸出來的一系列問題包括: 哪個產業現在最熱門?哪些正在失去吸引力? 工作時間長的職業是不是薪資也符合公平地比較高呢? 哪個產業現在供不應求? 供不應求的產業薪資有比較高嗎?還是正因為是爛缺所以沒人? 哪個產業的工作最爽(錢多、事少)? 以及另一個筆者個人覺得也很有趣的問題: 男女的職場選擇和待遇有什麼不同? 為了回答這些問題,筆者從主計處的統計資料庫當中分批分項撈出資料,再合併整理為統一的格式。筆者所挑選的產業包括工業部門的 5 個子產業項目以及服務業部門的 16 個子產業項目。 產業之間比較的標準則包括:平均就業人數、平均行業月薪、平均每月工時、平均進出/退出的比率。 筆者將分篇逐項來探討這些問題,首先第一個問題是: 哪個產業現在最熱門?哪些產業正在失去吸引力? 從下方圖表中可以發現,「住宿及餐飲業」、「不動產業」以及「創作及藝術表演業」是過去四年中就業人數成長最多的業別,與基準年 2010 年相比,大幅成長 19-27%。 探究原因,不動產業的崛起與這幾年房仲業紛紛祭出新人前半年即使沒有績效也可以暫時享有高薪的政策有關,房價節節上升促使可抽成的交屋佣金提高可能也是吸引新人投入的誘因。不過在一片打房喊聲下,或許這兩年就會看到一些調整。 年輕人對於創作與藝術表演類的就業興趣增加在近幾年文青風氣的盛行下並不令人意外,類似地,住宿餐飲類別也取得了相當的成長,除了在「小確幸」的夢想推波助瀾下街頭巷尾咖啡小店一間一間開,各品牌連鎖店也同樣大打擴張策略,都助長了實質就業人數的提升。 但有一點值得觀察的是,一些連鎖品牌(特別是茶飲)的盲目擴張下,隱藏的是本業營運不佳的廠商試圖混水摸魚的事實,不思索本業的進步,轉而不停擴充強打知名度來吸引夥伴並收取加盟金,等待短期獲利後再惡性退出的案例也時有所聞。總結而言,不良店家的倒閉或萎縮可能會減少產業的就業人數,但幾年內整體就業人力的持續成長仍是可以預期的。 在就業人數衰退方面,則以「礦業與土石採取業(衰退 9.6% )」、「運動、娛樂及休閒服務業(衰退 6% )」及「美髮及美容美體業(衰退 7.4% )」為最。 礦業與運動娛樂的衰減原因不明,而美容美髮方面如果讀者有注意,可能會發現生活圈中有不少美髮店已經悄悄歇業了,這或許是受到越來越盛行的百元平價剪髮品牌的衝擊,加上美容美髮業本身並不是獲利特別高的業別,兩者加乘的結果。 那麼大家所關心的薪資方面又是如何呢?在下一篇文章中將繼續為你解密。 更多產業分析精選文章: * 產業百百種,哪個最熱門?哪個薪水高?最新就業分析帶你一探究竟 (二) * 證所稅的一頁矛盾 * 大選的經濟學趣味 * 服務科學課程回顧: 服務行銷與管理 * 服務科學課程回顧: 服務科學實務(SERVICE IN PRACTICE) * 自我效能(SELF-EFFICACY)觀點:解析自我感覺良好

Excel VBA – 讓 User Form 右上角出現放大縮小按鈕的方法

在撰寫 Excel VBA 時,經常會用到 User Form 來製作呼叫面板,尤其是巨集準備要給別人使用的時候,有一個 User Form 可以省去很多麻煩。 User Form 雖然方便,但在設定上卻很死板,像是各種瀏覽器一定會有的放大縮小功能,沒有內建的選項可以設置: 透過程式的方式可以加以控制,例如這裡的 User Form 程式碼範例。 這樣使用起來其實不是很方便,有沒有方法可以在 User Form 上增加常見的放大縮小按鈕呢? 當然有,利用下面的程式碼,貼上到 User Form 當中可以了! Private Declare Function FindWindow Lib “user32″ Alias “FindWindowA" (ByVal lpClassName As String, ByVal lpWindowName As String) As Long Private Declare Function ShowWindow Lib “user32″ (ByVal… Continue Reading

統計R語言實作筆記系列 – R的字串處理:grep套件包(grep、grepl、regexpr、gregexpr、regexec)

差不多從 7、8 年前首次聽到 R 這個名字的時候開始,就對於 R 有一個刻板印象:「很好的數值資料處理工具,但並不擅長用來處理文字資料」。 最近因為有個小任務需要把非結構文字資料轉為結構化的矩陣,趁著這個機會也更新一下自己對 R 的認識,在找資料的過程才發現即使是「中文字串」這個 Text-Mining 當中的煩人問題,現在也可以透過 R 當中的套件做快速的處理,分析者甚至不需要了解何謂程式語言中的 regular expression,簡直神奇!

Excel 交互參照必學神器, 用 lookup 系列函數一鍵搞定資料比對 : hlookup篇

延續上一篇的 vlookup 教學文章,藉由先給定參照值,再於指定範圍內尋找符合條件的資料並傳回指定「欄位」的對應數值,藉著介紹的 hlookup 也大同小異,但找到符合條件的資料後卻是傳回指定「列」的對應數值。 由於大部分資料庫匯出的格式,欄位代表的是變數,列資料代表的是樣本(或筆數),以至於絕大部份時候會用到的是 vlookup ,因為我們希望回傳的通常是同一筆樣本在不同變數的數值,這樣就能夠在不同的資料庫(例如客服中心電話紀錄 vs 銷售紀錄)根據相同的 key 值(例如客戶編號),建立一個新的資料集或摘要表來使用,但有些時候 hlookup 也是可以派得上用場,像是典型的實驗設計表格。 範例表格如下,這是一個飲料好感度盲測研究的實驗資料。 假如我們想把指定的資料填入一組如下方的特定清單,該怎麼做呢? 當然就是要透過 hlookup 囉! 如同 vlookup , hlookup 也擁有 4 個參數,唯一的差別是傳回值的參數,在 vlookup 中是「Col_index_num」,可指定要傳回數值的垂直範圍,在 hlookup 中則是「Row_index_num」,用來指定要傳回數值的水平範圍。 Lookup_value 想要指定的參照值在此設定,以本例而言,是各廠牌的飲料名稱,先選擇摘要工作表中的 A1:A10 範圍作為參照值。 Table_array 接著指定要被比對的資料範圍在此設定,至少需要包含兩列(Row),一列用來和參照值比對,另一列則是提供要回傳的資料。以本例而言,選擇 A1:K5 的範圍。 Row_index_num 針對被比對的資料範圍(根據 Table_array 設定的範圍),指定要回傳的值,指定的方式是選擇所要回傳的「第幾列」的資料,順序由上至下。以本例而言,希望回傳盲測組 C 的評分,也就是第 4 列,填入數字 4。 Range_lookup 這是一個邏輯判斷式,填入「TRUE」or「FALSE」以指定選擇的標準。若填上 FALSE… Continue Reading

Excel 交互參照必學神器, 用 lookup 系列函數一鍵搞定資料比對 : vlookup篇

有一陣子沒有寫部落格了,最近遇見很多年輕的朋友,發現許多人等到進入職場以後,才發現原來職務說明中所謂「具備運用 Excel 的能力」,並不是指能夠打打加減乘除而已,只有學會了運用 Excel 的函數,才能在資料分析時達到事倍功半的效果,也才算是真正會用 Excel。 正因如此,就來分享一下 Excel 的使用技巧吧。 Excel 當中主要的函數列表,可以參考 Microsoft 提供的清單(按此)。在官方的分類底下,有一類就叫做「查閱與參照函數」,相同的分類也可以在各版的 Excel 函數說明中找到,可惜對於 Excel 使用不深的人,比起「統計」、「財務」等類別,這是一個經常會被遺忘的函數集,不過若以泛用性而言,參照函數或許才是各 Excel 課程首先必須著墨的部分。 不得不說,它真的太重要啦,在企業中 Excel 的使用量很大,就算自己不用,你的客戶或供應商八成也都用得很兇,而且 Excel 的應用範圍也很廣,幾乎所有部門都能用得到,各種專案合作中只要看到別人該用卻不用對應的函數,只靠手動製作資料摘要,我就會忍不住內心嘆氣+翻白眼,因為這實在是太浪費人力了,畢竟好人才的時間成本可是很貴的啊!! 各位看官,介紹參照函數必學第一名,就是大名鼎鼎的「vlookup」函數。 假如你有以下的狀況…: 必須同時管理許多個部份資料有重疊的工作表 沒有任何單一工作表包含所有要用到的資料欄位 工作表的資料筆數很多,不太可能花時間人工一一對照 那麼再不學 vlookup ,就真的太遜啦! 還不快看看底下的 vlookup 教學! 本文用氣象局的觀測資料為例,範例包含兩個工作表各自包含「酸雨PH值」及「雨量」的資料,其中「地點(鄉鎮名)」是兩個資料集的共同點,如下圖所示: 這裡另外加入一個獨立的工作表,包含了鄉鎮名稱資料方便檢視結果。 假如我們想要建立一個包含鄉鎮、雨量以及酸雨PH值的資料集(如 test 工作表的範例),那麼該怎麼做? 如果不利用 Excel 函數,那麼恐怕我們就得一筆一筆資料尋找,然後複製貼上了,假若只有幾個地點那倒無所謂,但是面對數百個鄉鎮地點,顯然最好的辦法不是手動。藉由 vlookup 函數,我們可以設定一組參照值,然後讓公式根據參照值,在給定的工作表每一列當中尋找符合參照值的資料,回傳設定好的欄位所對應的數值。 然後呢? 點兩下複製公式到所有格子就完成了! 就這麼簡單。 vlookup 共有幾個參數要設定,一一說明如下:… Continue Reading

通往線性代數的聖母峰 : 特徵值分解(EVD)、奇異值分解(SVD) 與主成分分析(PCA)

聖母峰的譬喻很有趣,原文來自交大周志成老師的線代啟示錄部落格,周老師文章裡曾說線代領域有兩座聖母峰,一座叫Jordan Form用來判斷矩陣相似問題,另一座就是奇異值分解(SVD,Singular Value Decomposition)。 特徵值( Eigenvalue )、奇異值( Singular Value )以及相關的矩陣觀念(正交、正規、跡數、對稱、轉置共軛、么正、可逆與不可逆、行列式、實數域與複數域、正定與半正定、可對角化、相似、秩…etc )在線性代數中都是重要的觀念,不過篇幅有限不可能一一討論,所以本文的重點將放在 SVD 的原理與類似方法的比較,因此延伸的線性代數知識都將予以簡化或略過以免模糊焦點。