(Day 1) 介紹與準備
在學習機器學習 (Machine Learning) 的過程中,可能會陷入兩種極端,一種是只會調用套件 (套模),模型背後的機制一知半解,遇到問題只能「換模型試試看」,或者是過度陷入數學細節,花大量時間推導公式,卻無法轉化為實際應用與模型選擇能力。
我本身是從商業分析背景轉入人工智慧領域的研究者。這段轉型過程中,逐漸體會到: 真正困難的不是學會用模型,而是理解模型為什麼有效、什麼時候該用、什麼時候該換、用了之後該觀察什麼訊號。這促使我開始重新梳理各類常見演算法的行為與應用邏輯。
因此,我決定透過這次 iThome 鐵人賽的機會,整理與統整常見演算法的核心概念,並將每一篇視為一場與模型的深度對談。
系列架構說明
本系列分為兩大部分:
- 經典機器學習模型: 聚焦於 Regression、Classification、Clustering 等常見方法,強調模型背後的核心邏輯、適用情境與評估指標。
- 深度學習模型: 介紹常見神經網路架構,如全連接神經網路 (FCNN)、CNN、RNN、Transformer 等,並探討它們對資料型態、任務種類的適應性與限制。
每篇文章皆會包含模型概念說明與簡潔的 Python 範例實作,並聚焦於模型本身的行為與選擇策略,不深入探討資料前處理、特徵工程、模型調參、數學推導等高階內容,以避免模糊焦點。
技術範圍與預期對象
本系列預設讀者已具備以下條件:
- 具備基礎統計學與資料科學知識
- 具備基本 Python 語法能力
- 具備 scikit-learn, PyTorch, TensorFlow, Keras 基本建模流程
學習深度定位: 聚焦在 Level 2–3 之間
等級 | 定義 | 在本系列的實踐目標 |
---|---|---|
Level 1 | 會用套件建模 | ✅ 使用 sklearn 等工具快速建模 |
Level 2 | 理解模型的概念與原理 | ✅ 說得出每個模型的邏輯與核心機制 |
Level 3 | 能比較模型優劣與應用場景選擇 | ✅ 理解適用時機、模型之間的 trade-off |
Level 4+ | 深入優化與理論推導 | 🚫 本系列不會深入涵蓋,建議另尋高階資源 |
系列預告與進展節奏
本系列將以「一日一模型」為目標,每篇聚焦於一個經典或常見模型,從實用視角出發說明其:
- 核心邏輯與設計理念
- 適用情境與限制條件
- 與其他模型的比較與選擇策略
- Python 範例實作與評估觀察
預計涵蓋模型範圍包括: Linear Regression、Polynomial Regression、Logistic Regression、SVM、KNN、Decision Tree、Random Forest、XGBoost、PCA、KMeans、FCNN、CNN、RNN、Transformer … 等。
結語
在進入每個演算法之前,我希望你能先釐清這個系列的定位與期望。這不是一套填鴨式教材,也不是數學推導教科書,而是為了介紹模型的直覺、判斷力與選擇能力。每一篇文章都像是與一個模型深談五分鐘──理解它在想什麼、擅長什麼、又有哪些盲點、怎麼樣可以更好。
本系列更像是一本實務導向的演算法導覽手冊,不追求全面、但講求理解關鍵。你不需要一次學會所有細節,而應該學會如何觀察、思考與應變。