機器學習裡不存在的免費午餐:No Free Lunch Theorems

不久之前參加了國內資料科學 / AI 的年度盛事,一方面有感於機器學習領域近年的飛速發展,另一方面覺得衍生的誤解與迷思幾乎也用同樣的速度在擴散,連 Facebook 的 AI 大神 Yann LeCun 在接受訪談的時候都明白表示希望大家不要再用魔鬼終結者的形象來解釋 AI ,因為這種印象完全是錯誤的。

《合伙人:如何發掘高潛力人才》的企業人員聘用秘訣

一年前在班機嚴重延誤的北京機場買下這本書《合伙人:如何發掘高潛力人才》,那時候我正在參與一個後來的組織改造計畫(當時還在非常保密的階段),在計畫的執行過程中我親身體驗到許多人員管理與變革上的壓力與挑戰,這個時刻讀到作者費洛迪( Claudio Fernández-Aráoz )書中提到的種種處境甚是感觸良多,已經很久不曾在短時間內把一本書重複看過三次了。

《從 0 到 1》的 3 個創業關鍵學習

相較於層出不窮的創業心得,《從 0 到 1》真的是比較好看的一本,但跟許多暢銷書一樣, Peter Thiel 兩年前這本由課堂紀錄改編而成的著作雖然推出的時候造成轟動,現在已經沒有多少人討論。 網路上有許多資源可以找到這本書:簡體中文版、英文版。 在這種背景下重新閱讀書中的論點並細細思考,更能體現其中精華而不受外在的流行所干擾。其中有三件事我特別覺得收穫有感。

初心者也會用的 R 語言讀取 XML 資料分析實戰教學!(三)

前兩篇文章已經介紹過處理 XML 資料的前備知識以及 R 語言 XML 套件的常用功能,是時候磨刀上陣了!本文將採用政府開放資料中的台鐵、高鐵以及微軟 XML 教學檔案進行範例演練,內文中使用到相關的套件及語法將不在一一細述,請參考前兩篇文章的說明。 XML 資料來源: 1. 台鐵時刻表 2. 高鐵時刻表 3. 微軟提供的範例檔

初心者也會用的 R 語言讀取 XML 資料分析實戰教學!(二)

在前一篇教學當中,我們已經看過 XML 的樹狀節點結構、 XML Schema 以及 R 語言 XML 套件的常用功能,在接下來的內容當中,我們將繼續研究 Xpath 語法,並介紹好用的視覺化工具 XML Viewer ,讀者可以搭配閱讀第一篇文章所列出 XML 包的功能作為補充。 剛試用 R XML 套件來讀取 XML 的時候應該不少人會有這樣的疑問:我要如何擷取一份 XML 中特定節點的屬性或者資料?

初心者也會用的 R 語言讀取 XML 資料分析實戰教學!(一)

隨著 API 經濟遍地開花,應用程式與資料源之間的互動實作成為現代軟體工程師必備的基本能力,其中最常見的中前端資料交換格式有 XML 及 JSON 等等,其中 XML 由於傳統商用等級的服務高度支援,且各程式語言都具備完整成熟的套件體系,讀取 XML 對於資料工程師或資料科學家的日常工作而言可說是不可或缺的一部分。 XML 是一種標記語言,類似網頁 HTML ,透過 < 各種TAG > 的定義統一化規格並豐富化資料意義,配合 Schema 讓資料結構具備高度可程式化能力,再加上容易維護的優勢,在許多資料串接實務中是很流行的通用資料格式(別再說只會 CSV 啦!)。 可惜的是,許多立志朝向資料科學領域的學生很容易忽略 XML 的學習,加上網路上搜尋「 R XML」的熱門網頁例如這篇教學《使用 R 讀取開放資料 (CSV, XML, JSON)》通常比較簡略,因此有了這篇教學分享文章的誕生,讓我們一起來練習。

重讀《經理人的一天》,與我在高階主管們身邊的日子(二)

前一篇文章談到的管理工作複雜性是現代經理人的一項課題,因為無法事先訓練,另一個同樣困擾著許多經理人的挑戰,卻是看似再平凡不過的日常工作排程。 在一些忙碌的日子裡,一個中階業務主管的日常可能要造訪 3 – 5 家稍具規模的客戶,許多客戶喜歡直到最後一刻才敲定時間,另一些客戶則可能臨時行程需要異動但希望改期的約會能「 ASAP(越快越好) 」,滿滿的行事曆當中一個意料之外的變動就可能弄得人仰馬翻,排定一個訓練課程或一個會議所需要的聯絡與協調時間,有時甚至超過會議本身。

重讀《經理人的一天》,與我在高階主管們身邊的日子(一)

專業經理人的名分對於 MBA 學生而言似乎有著一種特殊的魔力,許多泛管理學門學生的畢生志業就是能加入知名的企業當中逐步升遷成為一個獨當一面的經理人,這也是許多 MBA 學府用來宣傳的招生口號。 近來與一些後輩討論職涯問題時對方往往也表現出相同的嚮往,而當問到成為經理人的必要資質以及是否準備好面臨經理人的工作挑戰時,才往往在最後一刻發覺,原來我們心中所參考的經理人形象有著天與地的差別…。

統計R語言實作筆記系列 – 用 Shiny 套件極速打造你的商業智慧分析網站!

早在 Big Data 一詞還未深入人心之前,商業智慧分析系統就已經在企業級應用領域有著長足的歷史,由國際知名的軟體公司設計的 Business Intelligence 產品的一貫傳統就是配上可以由客人自定義而且視覺化效果華麗的功能性圖表,又經常稱為企業儀表板 ( DashBoard ),能夠讓用戶根據不同的選項操作來從各種角度分析企業的即時經營數據。 而在以 R 為主要工具的資料科學社群中, Shiny 無疑是最佳的儀表板製作工具,它不但提供了免費版本,能讓你輕易地部署到網路上,而且也能搭配原先 R 就已經很強大的套件來執行資料重整、分析及繪圖,非常適合預算有限但需求殷切的企業用來打造屬於自己的 prototype 商業智慧系統。