如何製作詞雲圖 (斷詞、詞頻統計)?

進入【統計分析】-【基礎統計】,創建新圖表。

將需要統計詞頻的變數拖拽至「維度」,以文本為資料類型的變數均可,在變數的下拉小三角中選擇「統計方法」-「斷詞」,選擇語言類型和詞語的統計數量。即可實現對文本欄位的切詞和詞頻統計。

在右側圖表樣式中,選擇圖表類型中的“詞雲圖”形式 ,即可出現詞雲圖。進一步點擊「圖表樣式」中的「熱詞管理」,實現自訂詞雲圖中的呈現詞語。

注意:因抽樣庫中的資料混在其母體資料庫中,因而在製作統計分析圖表時,如存在抽樣庫,則需透過「篩選」特定資料庫,設定需要進行統計分析的資料範圍。

可透過「停用」來自定義刪除顯示在詞雲圖中的詞語,被停用的詞語會顯示在「停用詞」一欄。

點選「下載」即可將停用詞列表的TXT檔下載至此電腦。也可「上傳」停用詞的列表TXT檔。點選「復用」即還原對該詞語的停用,點選「清空」即刪除停用詞中的所有詞語,該些詞語將會顯示在詞雲圖中。

透過組合新詞整理同類詞語,顯示在詞雲圖中。如「明教」和「教主」可組合成「明教教主」,點選「新增組合」,選擇需要組合的詞語,為該些詞語命名。

點選「清空」即刪除掉了所有的組合詞。

編輯好熱詞後,點選「確定」,回到圖表編輯界面,點選「儲存」,將詞雲圖儲存至特定檔案夾即可。

點選詞雲圖中的關鍵詞即可顯示該詞語的來源文章,方便針對關鍵詞進行進一步的深入解讀。

Was this article helpful?

Related Articles