跳到主要內容

發表文章

目前顯示的是 2023的文章

【Google Colab Python系列】 視覺化資料Matplotlib 新手村

  圖片來源 相信視覺化報表對於資料科學來說是非常重要的一環, 透過圖表來呈現資料的樣態, 過程中分析模型訓練時, 觀察訓練的收斂趨勢是否如我們預期, 視覺化加速我們的判斷時間, 節省找問題的成本。 數據就如同鐵證一般, 當我們常常苦於為什麼訓練出來的A模型這麼差勁,但B模型卻非常好, 這中間發生了什麼事情, 通常沒有一個數據的話, 我們只能憑感覺, 但感覺這東西很微妙也很主觀, 常常因為我們當時看到的視角太狹隘而得出錯誤的結論, 因此最好的方式就是讓「數據」來說明一切, 呈現「數據」最好的幫手就是「視覺化圖表」了。 而在Python的世界裡, 常拿來被使用的視覺化套件是「 Matplotlib 」, 也是這個篇章即將介紹的一個利器, 功能非常豐富, 常見的線圖、散點圖、直方圖、長條圖、餅圖…都難不倒它, 難的是我們會不會使用它, 因此非常值得我們好好的學習一番。 導覽 我們可以看到官網的範例圖表非常的豐富, 涵蓋各式各樣的統計分析圖。 https://matplotlib.org/stable/gallery/index.html 圖片來源 圖片來源 在龐大的範例池裡挖呀挖呀挖, 一篇接著一篇有點挖不完的感覺…, 但不要害怕, 我們將一步步的進行教學。 當然官方網站也提供了使用者指南, 如果需要更詳細的資訊也歡迎直接上官網: https://matplotlib.org/stable/users/index.html 圖片來源 知己知彼,百戰百勝: 認識架構 Figure(圖片):整個圖表的最外層容器。一個Figure對應於一張圖片,可以包含多個子圖(Axes)。 Axes(座標軸):即子圖,是在Figure中的一個繪圖區域。每個Axes都有自己的座標系,可以設置座標軸的範圍、標籤、刻度等。 Axis(坐標軸):Axes上的x軸和y軸,用於顯示數據的範圍和刻度。 Artist(圖形元素):包括線條、文本、圖片等用於繪製圖表的元素。 圖片來源 啟航: 快速安裝 以下是使用Python pip套件管理程式進行安裝, 如果是使用conda的朋友可以這樣安裝:  conda install -c conda-forge matplotlib pip install matplotlib 練功:一步一腳印 簡單的五個步驟,讓我們親手繪製出長條圖。 引入模組 import