Data Science IThome 鐵人賽 2025 30 天入門常見的機器學習演算法

(Day 1) 介紹與準備

謝志謙

Jul 30, 2025

在學習機器學習 (Machine Learning) 的過程中，可能會陷入兩種極端，一種是只會調用套件 (套模)，模型背後的機制一知半解，遇到問題只能「換模型試試看」，或者是過度陷入數學細節，花大量時間推導公式，卻無法轉化為實際應用與模型選擇能力。

我本身是從商業分析背景轉入人工智慧領域的研究者。這段轉型過程中，逐漸體會到: 真正困難的不是學會用模型，而是理解模型為什麼有效、什麼時候該用、什麼時候該換、用了之後該觀察什麼訊號。這促使我開始重新梳理各類常見演算法的行為與應用邏輯。

因此，我決定透過這次 iThome 鐵人賽的機會，整理與統整常見演算法的核心概念，並將每一篇視為一場與模型的深度對談。

系列架構說明

本系列分為兩大部分:

經典機器學習模型: 聚焦於 Regression、Classification、Clustering 等常見方法，強調模型背後的核心邏輯、適用情境與評估指標。
深度學習模型: 介紹常見神經網路架構，如全連接神經網路 (FCNN)、CNN、RNN、Transformer 等，並探討它們對資料型態、任務種類的適應性與限制。

每篇文章皆會包含模型概念說明與簡潔的 Python 範例實作，並聚焦於模型本身的行為與選擇策略，不深入探討資料前處理、特徵工程、模型調參、數學推導等高階內容，以避免模糊焦點。

技術範圍與預期對象

本系列預設讀者已具備以下條件:

具備基礎統計學與資料科學知識
具備基本 Python 語法能力
具備 scikit-learn, PyTorch, TensorFlow, Keras 基本建模流程

學習深度定位: 聚焦在 Level 2–3 之間

等級	定義	在本系列的實踐目標
Level 1	會用套件建模	✅ 使用 sklearn 等工具快速建模
Level 2	理解模型的概念與原理	✅ 說得出每個模型的邏輯與核心機制
Level 3	能比較模型優劣與應用場景選擇	✅ 理解適用時機、模型之間的 trade-off
Level 4+	深入優化與理論推導	🚫 本系列不會深入涵蓋，建議另尋高階資源

系列預告與進展節奏

本系列將以「一日一模型」為目標，每篇聚焦於一個經典或常見模型，從實用視角出發說明其:

核心邏輯與設計理念
適用情境與限制條件
與其他模型的比較與選擇策略
Python 範例實作與評估觀察

預計涵蓋模型範圍包括: Linear Regression、Polynomial Regression、Logistic Regression、SVM、KNN、Decision Tree、Random Forest、XGBoost、PCA、KMeans、FCNN、CNN、RNN、Transformer … 等。

結語

在進入每個演算法之前，我希望你能先釐清這個系列的定位與期望。這不是一套填鴨式教材，也不是數學推導教科書，而是為了介紹模型的直覺、判斷力與選擇能力。每一篇文章都像是與一個模型深談五分鐘──理解它在想什麼、擅長什麼、又有哪些盲點、怎麼樣可以更好。

本系列更像是一本實務導向的演算法導覽手冊，不追求全面、但講求理解關鍵。你不需要一次學會所有細節，而應該學會如何觀察、思考與應變。

備註

同步發表於 iThome 鐵人賽 2025 - 30 天入門常見的機器學習演算法

Share this article

(Day 1) 介紹與準備

系列架構說明

技術範圍與預期對象

學習深度定位: 聚焦在 Level 2–3 之間

系列預告與進展節奏

結語

備註

學歷無用? 我仍相信學習的價值

(Day 2) 線性迴歸 (Linear Regression)