圖片來源 相信視覺化報表對於資料科學來說是非常重要的一環, 透過圖表來呈現資料的樣態, 過程中分析模型訓練時, 觀察訓練的收斂趨勢是否如我們預期, 視覺化加速我們的判斷時間, 節省找問題的成本。 數據就如同鐵證一般, 當我們常常苦於為什麼訓練出來的A模型這麼差勁,但B模型卻非常好, 這中間發生了什麼事情, 通常沒有一個數據的話, 我們只能憑感覺, 但感覺這東西很微妙也很主觀, 常常因為我們當時看到的視角太狹隘而得出錯誤的結論, 因此最好的方式就是讓「數據」來說明一切, 呈現「數據」最好的幫手就是「視覺化圖表」了。 而在Python的世界裡, 常拿來被使用的視覺化套件是「 Matplotlib 」, 也是這個篇章即將介紹的一個利器, 功能非常豐富, 常見的線圖、散點圖、直方圖、長條圖、餅圖…都難不倒它, 難的是我們會不會使用它, 因此非常值得我們好好的學習一番。 導覽 我們可以看到官網的範例圖表非常的豐富, 涵蓋各式各樣的統計分析圖。 https://matplotlib.org/stable/gallery/index.html 圖片來源 圖片來源 在龐大的範例池裡挖呀挖呀挖, 一篇接著一篇有點挖不完的感覺…, 但不要害怕, 我們將一步步的進行教學。 當然官方網站也提供了使用者指南, 如果需要更詳細的資訊也歡迎直接上官網: https://matplotlib.org/stable/users/index.html 圖片來源 知己知彼,百戰百勝: 認識架構 Figure(圖片):整個圖表的最外層容器。一個Figure對應於一張圖片,可以包含多個子圖(Axes)。 Axes(座標軸):即子圖,是在Figure中的一個繪圖區域。每個Axes都有自己的座標系,可以設置座標軸的範圍、標籤、刻度等。 Axis(坐標軸):Axes上的x軸和y軸,用於顯示數據的範圍和刻度。 Artist(圖形元素):包括線條、文本、圖片等用於繪製圖表的元素。 圖片來源 啟航: 快速安裝 以下是使用Python pip套件管理程式進行安裝, 如果是使用conda的朋友可以這樣安裝: conda install -c conda-forge matplotlib pip install matplotlib 練功:一步一腳印 簡單的五個步驟,讓我們親手繪製出長條圖。 引入模組 import