怎樣用Python生成詞云圖?wordcloud可視化指南

生成詞云圖的關鍵在于準備數據和調整參數。1.安裝wordcloud、matplotlib和jieba庫;2.獲取并讀取文本數據,中文需用jieba分詞處理;3.調用wordcloud類生成詞云,注意設置字體、尺寸和背景色;4.可選自定義形狀和顏色,通過mask參數使用圖像模板,結合colormap配色,并用stopwords過濾無意義詞匯。整個過程步驟清晰,但需注意細節如中文字體支持和遮罩格式。

怎樣用Python生成詞云圖?wordcloud可視化指南

生成詞云圖其實不難,python里有一個叫wordcloud的庫,專門用來做這種可視化。你只需要準備好文本數據,調用幾個函數就能生成漂亮的圖片。當然,要讓它看起來更專業、更有針對性,還是得注意一些細節。

怎樣用Python生成詞云圖?wordcloud可視化指南

安裝必要的庫

首先你得確保安裝了wordcloud和matplotlib這兩個庫。如果還沒裝,可以用pip命令

怎樣用Python生成詞云圖?wordcloud可視化指南

  • pip install wordcloud
  • pip install matplotlib

有時候還需要處理中文,這時候建議順便裝上jieba分詞庫:

立即學習Python免費學習筆記(深入)”;

  • pip install jieba

這幾個庫裝好之后,就可以開始制作詞云了。

怎樣用Python生成詞云圖?wordcloud可視化指南

準備文本數據

詞云的基礎是文本內容。你可以從各種地方獲取文本,比如網頁爬蟲、本地txt文件、社交媒體評論等等。只要把文本讀進來就行。

舉個例子,如果你有一個text.txt文件,可以這樣讀取內容:

with open('text.txt', 'r', encoding='utf-8') as f:     text = f.read()

如果是中文文本,一般還要先做分詞。這時候就用到前面提到的jieba了:

import jieba words = " ".join(jieba.cut(text))

這樣就把一段中文拆成一個個詞語,并用空格連接起來,方便后續處理。

生成基本詞云

有了文本之后,就可以創建詞云對象并生成圖像了。基礎代碼大概是這樣的:

from wordcloud import WordCloud import matplotlib.pyplot as plt  wc = WordCloud(font_path='simhei.ttf', width=800, height=600, background_color='white') word_cloud = wc.generate(words)  plt.imshow(word_cloud) plt.axis("off") plt.show()

這里面有幾個關鍵參數:

  • font_path:指定字體文件,特別是顯示中文時必須設置,否則會報錯或者出現方框。
  • width 和 height:控制輸出圖片的尺寸。
  • background_color:設置背景顏色,默認是黑色,也可以改成白色或其他顏色。

如果你不想手動調整這些參數,也可以直接使用默認值,但效果可能沒那么理想。

自定義詞云形狀和顏色

如果你想讓詞云更有特色,比如變成心形、圓形或者其他形狀,可以用mask參數來實現。你需要準備一個黑白圖像作為模板,然后傳給WordCloud。

步驟大致如下:

  • numpy讀取圖像,轉為數組
  • 創建WordCloud對象時加入mask=image_array
  • 如果需要顏色也可以結合colormap設置配色方案

另外,還可以通過stopwords參數過濾掉你不想要的詞,比如“的”、“了”、“是”這類常見但無意義的詞匯。


基本上就這些操作了。雖然步驟看起來有點多,但其實每一步都不復雜,只是容易忽略某些小細節,比如中文字體、停用詞、圖像遮罩格式等。只要你一步步來,很快就能做出好看的詞云圖。

? 版權聲明
THE END
喜歡就支持一下吧
點贊5 分享