統計R語言實作筆記系列 – R的字串處理:grep套件包(grep、grepl、regexpr、gregexpr、regexec)

差不多從 7、8 年前首次聽到 R 這個名字的時候開始,就對於 R 有一個刻板印象:「很好的數值資料處理工具,但並不擅長用來處理文字資料」。 最近因為有個小任務需要把非結構文字資料轉為結構化的矩陣,趁著這個機會也更新一下自己對 R 的認識,在找資料的過程才發現即使是「中文字串」這個 Text-Mining 當中的煩人問題,現在也可以透過 R 當中的套件做快速的處理,分析者甚至不需要了解何謂程式語言中的 regular expression,簡直神奇!