Business Analysis and Big Data - text mining for the current status of Virtual Reality by WordCloud
文字探堪的第一步,首先就是斷字。斷字完成後就可以對字詞發生的頻率做統計。
將字詞發生頻率以圖像化呈現出來的方法有許多不同,其中最常使用的方法之一就是字雲圖 (WordCloud)。
下圖是2015年在推特(Twitter)上有關Virtual Reality的推文所呈現出來的字雲圖:
以VR為中心,呈現依出現頻率的字詞,頻率愈高,字體愈大,愈靠近中心。當然這只是文字探堪演算法中,最初步及簡單的做法之一。
在大數據的時代,身為一個商業分析師,在執行現況分析(current status analysis)時,使用的技術也要做相對的擴展。這也是為什麼BABOK III特別從Business Intelligence來探討商業分析師在21世紀的新角色 - A navitator for an initiative。
將字詞發生頻率以圖像化呈現出來的方法有許多不同,其中最常使用的方法之一就是字雲圖 (WordCloud)。
下圖是2015年在推特(Twitter)上有關Virtual Reality的推文所呈現出來的字雲圖:
以VR為中心,呈現依出現頻率的字詞,頻率愈高,字體愈大,愈靠近中心。當然這只是文字探堪演算法中,最初步及簡單的做法之一。
在大數據的時代,身為一個商業分析師,在執行現況分析(current status analysis)時,使用的技術也要做相對的擴展。這也是為什麼BABOK III特別從Business Intelligence來探討商業分析師在21世紀的新角色 - A navitator for an initiative。
留言
張貼留言