Business Analysis and Big Data - text mining for the current status of Virtual Reality by WordCloud

文字探堪的第一步,首先就是斷字。斷字完成後就可以對字詞發生的頻率做統計。

將字詞發生頻率以圖像化呈現出來的方法有許多不同,其中最常使用的方法之一就是字雲圖 (WordCloud)。

下圖是2015年在推特(Twitter)上有關Virtual Reality的推文所呈現出來的字雲圖:


以VR為中心,呈現依出現頻率的字詞,頻率愈高,字體愈大,愈靠近中心。當然這只是文字探堪演算法中,最初步及簡單的做法之一。

在大數據的時代,身為一個商業分析師,在執行現況分析(current status analysis)時,使用的技術也要做相對的擴展。這也是為什麼BABOK III特別從Business Intelligence來探討商業分析師在21世紀的新角色 - A navitator for an initiative。

留言

這個網誌中的熱門文章

新的出發

IIBA CBAP還是PMI-PBA?

Business Analysis Core Concept Model, 商業分析核心觀念模型