CÔNG CỤ
MODULES
THAM KHẢO
Cách chia List thành các phần bằng nhau trong Python Cách xóa một khóa (key) ra khỏi dictionary trong Python Hướng dẫn chuyển đổi file Google Colab sang Markdown trong Python Bài tập Python: Lập trình cơ sở dữ liệu trong Python Kết nối cơ sở dữ liệu MySQL Python Hướng dẫn kết nối Python PostgreSQL bằng Psycopg2 Hướng dẫn kết nối SQLite sử dụng sqlite3 trong Python Bài tập Python : Pandas trong Python Phạm vi số float của Python Cách lên lịch chạy script Python bằng GitHub Actions Cách tạo hằng số trong Python Các nền tảng lưu trữ tốt nhất cho ứng dụng và script Python 6 Tip viết vòng lặp For hiệu quả hơn trong Python Cách đảo ngược Chuỗi String trong Python Cách gỡ lỗi ứng dụng Python trong Docker Container bằng VS Code 10 tip One Liner bạn cần biết trong Python Cách áp dụng ngưỡng hình ảnh trong Python với NumPy Tìm hiểu về các phép toán Groupby trong Pandas Lập trình Socket trong Python Mô-đun base64 trong Python Cách giới hạn float values trong Python Tìm hiểu Mô-đun statistics Trong Python File Organizing trong Python Đổi tên File trong Python Tìm hiểu về Deque trong Python Mô-đun Calendar trong Python Tìm hiểu về Enum trong Python Sử dụng pprint trong Python Làm việc với cấu trúc Dữ liệu Stack trong Python Thư viện functools trong Python Tip sử dụng hàm round() với tham số âm trong Python Hàm print có thể nhận thêm các tham số bổ sung trong Python Tip tìm chuỗi dài nhất bằng hàm max() trong Python Cách lặp qua nhiều list với hàm zip() trong Python Tìm hiểu về MLOps trong Python Docker và Kubernetes với MLOps trong Python Kết hợp DevOps với MLOps trong Python Xử lý độ chính xác các hàm floor, ceil, round, trunc, format trong Python tối ưu quy trình MLOps Với Python Sự khác biệt giữa byte objects và string trong Python Top 4 thư viện phổ biến nhất của NLP trong Python Cách sử dụng ThreadPoolExecutor trong Python Phân tích dữ liệu Blockchain với Python Hướng dẫn triển khai Smart Contracts với Python Blockchain APIs với Python Làm việc với file ZIP trong Python Sự khác biệt giữa toán tử == và is trong Python Chuyển đổi kiểu dữ liệu trong Python Cách làm việc với file tarball/tar trong Python Sự khác biệt giữa iterator và iterable trong Python Sự khác biệt giữa set() và frozenset() trong Python Làm việc với các biến môi trường trong Python Một tác vụ phổ biến khi làm việc với danh sách trong Python Định dạng chuỗi Strings trong Python Sử dụng Poetry để quản lý dependencies trong Python Sự khác biệt giữa sort() và sorted() trong Python Từ khóa yield trong Python Lớp dữ liệu (Data Classes) trong Python với decorator @dataclass Cách truy cập và thiết lập biến môi trường trong Python Hướng dẫn toàn diện về module datetime trong Python Hướng dẫn xây dựng Command-Line Interface (CLI) bằng Quo trong Python Sử dụng Virtual Environment trong Python Từ khóa super() trong Python Số phức trong Python Ý nghĩa của một hoặc hai dấu gạch dưới đứng đầu trong Python Làm việc với Video trong OpenCV bằng Python Chỉnh sửa file trực tiếp bằng module fileinput trong Python Hướng dẫn cách chuyển đổi kiểu dữ liệu trong Python Làm việc với hình ảnh trong OpenCV sử dụng Python Metaclasses trong Python Cách chọn ngẫu nhiên một phần tử từ danh sách trong Python Hướng dẫn cài đặt và sử dụng OpenCV trong Python Phạm vi toàn cục, cục bộ và không cục bộ trong Python Tìm hiểu về từ khóa self trong các lớp Python Hướng dẫn sử dụng Rich, Typer, và SQLite trên terminal bằng Python Giới thiệu về Graph Machine Learning trong Python Cách kiểm tra một đối tượng có thể lặp (iterable) trong Python Quản lý sinh viên Python & MySQL Cách cắt (slicing) chuỗi trong Python Cách loại bỏ phần tử trùng lặp khỏi danh sách (List) trong Python Phân tích dữ liệu Apple Health bằng Python Cách làm phẳng danh sách lồng nhau trong Python Tìm hiểu về *args và **kwargs trong Python Cách xóa file và thư mục trong Python 31 Phương thức xử lý chuỗi (String) quan trọng trong Python Cách sao chép file trong Python 8 Mẹo Refactor Code Python nhanh gọn (Phần 2) Cách yêu cầu người dùng nhập liệu đến khi nhận được phản hồi hợp lệ trong Python Làm chủ Pattern Matching trong Python 3.10 Tạo app ghi chú trong Python với nhận dạng giọng nói và API Notion Các tính năng mới trong Python 3.10 5 lỗi thường gặp trong Python Sự khác biệt giữa append() và extend() trong list Python Các cách nối hai danh sách trong Python Sự khác biệt giữa str và repr trong Python Sự khác biệt giữa @classmethod, @staticmethod và instance methods trong Python Cách thêm số 0 vào đầu chuỗi trong Python Cách tạo thư mục lồng nhau (nested directory) trong Python Cách hợp nhất hai Dictionaries trong Python Cách thực thi lệnh hệ thống hoặc System Command từ Python Cách kiểm tra một chuỗi có chứa chuỗi con trong Python Cách tìm chỉ mục của một phần tử trong danh sách (List) trong Python Cách truy cập index trong vòng lặp for trong Python Cách kiểm tra file hoặc thư mục có tồn tại trong Python Cách xóa phần tử trong danh sách Python Ý nghĩa của if __name__ == "__main__" trong Python 8 mẹo tái cấu trúc Python giúp mã sạch hơn và Pythonic Hỗ trợ Async trong Django 3.1 Hướng dẫn tạo ứng dụng AI hội thoại với NVIDIA Jarvis trong Python Hướng dẫn xây dựng ứng dụng dự đoán giá cổ phiếu bằng Python Cách cài đặt Jupyter Notebook trong môi trường Conda và thêm Kernel Xây dựng ứng dụng Web Style Transfer với PyTorch và Streamlit Cách sử dụng Python Debugger với hàm breakpoint() Cách sử dụng chế độ interactive trong Python Hướng dẫn viết game Rắn Săn Mồi bằng Python 11 mẹo và thủ thuật để viết Code Python hiệu quả hơn Hướng dẫn làm ứng dụng TODO với Flask dành cho người mới bắt đầu trong Python Hướng dẫn tạo Chatbot đơn giản bằng PyTorch Xây dựng Web Machine Learning đẹp mắt với Streamlit và Scikit-learn trong Python Xây dựng web Python tự động hóa Twitter | Flask, Heroku, Twitter API & Google Sheets API Hướng dẫn sử dụng Google Sheets API với Python Cách nạp dữ liệu Machine Learning từ File trong Python Toán tử Walrus Operator- Tính năng mới trong Python 3.8 Cách thêm Progress Bar trong Python với chỉ một dòng Code List Comprehension trong Python Tạo danh sách phim ngẫu nhiên với Python Hướng dẫn Web Scraping tự động tải hình ảnh với Python Hướng dẫn sử dụng Anaconda bằng Python Hồi quy tuyến tính và hồi quy Logistic trong Python Thuật toán Naive Bayes trong Python Bắt đầu tìm hiểu Perceptron bằng Python SVM (Support Vector Machine) bằng Python Triển khai Decision Tree bằng Python Triển khai thuật toán Random Forest bằng Python Triển khai PCA bằng Python Thuật toán AdaBoost trong Python LDA (Linear Discriminant Analysis) trong Python
PYTHON NÂNG CAO
CÁC CHỦ ĐỀ
BÀI MỚI NHẤT
MỚI CẬP NHẬT

Thông báo: Download 4 khóa học Python từ cơ bản đến nâng cao tại đây.

Hồi quy Logistic trong PyTorch Beginner

Trong phần này, mình sẽ triển khai thuật toán Logistic Regression (hồi quy logistic) bằng PyTorch và áp dụng các khái niệm đã học. Mục tiêu chính là phân loại nhị phân một cách hiệu quả bằng việc sử dụng mạng nơ-ron đơn giản kết hợp hàm kích hoạt sigmoid.

test php

banquyen png
Bài viết này được đăng tại freetuts.net, không được copy dưới mọi hình thức.

Logistic Regression (hồi quy logistic) bằng PyTorch

Pipeline này bao gồm các bước:

  • Chuẩn bị dữ liệu từ tập Breast Cancer trong sklearn.
  • Chuẩn hóa dữ liệu (feature scaling) để đảm bảo tốc độ hội tụ nhanh hơn.
  • Thiết kế mô hình hồi quy logistic với một lớp tuyến tính kèm hàm sigmoid để đưa ra xác suất.
  • Định nghĩa hàm mất mát (Binary Cross-Entropy) và trình tối ưu hóa (SGD).
  • Vòng lặp huấn luyện, kiểm tra hiệu năng của mô hình trên dữ liệu kiểm tra (Accuracy).
import torch
import torch.nn as nn
import numpy as np
from sklearn import datasets
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split

# 0) Chuẩn bị dữ liệu
bc = datasets.load_breast_cancer()
X, y = bc.data, bc.target  # Đặc trưng (features) và nhãn (labels)

n_samples, n_features = X.shape  # Số mẫu và số đặc trưng

# Tách dữ liệu thành tập huấn luyện và kiểm tra (80% huấn luyện, 20% kiểm tra)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=1234)

# Chuẩn hóa dữ liệu bằng StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform(X_test)

# Chuyển dữ liệu thành Tensor của PyTorch
X_train = torch.from_numpy(X_train.astype(np.float32))
X_test = torch.from_numpy(X_test.astype(np.float32))
y_train = torch.from_numpy(y_train.astype(np.float32))
y_test = torch.from_numpy(y_test.astype(np.float32))

# Điều chỉnh y thành vector cột
y_train = y_train.view(y_train.shape[0], 1)
y_test = y_test.view(y_test.shape[0], 1)

# 1) Mô hình
# Thiết kế hồi quy logistic f(x) = sigmoid(wx + b)
class Model(nn.Module):
    def __init__(self, n_input_features):
        super(Model, self).__init__()
        self.linear = nn.Linear(n_input_features, 1)  # Lớp tuyến tính wx + b

    def forward(self, x):
        y_pred = torch.sigmoid(self.linear(x))  # Thêm sigmoid để xuất ra xác suất
        return y_pred

model = Model(n_features)

# 2) Định nghĩa hàm mất mát và trình tối ưu hóa
num_epochs = 100
learning_rate = 0.01

# Hàm mất mát: Binary Cross Entropy (mất mát cho phân loại nhị phân)
criterion = nn.BCELoss()
optimizer = torch.optim.SGD(model.parameters(), lr=learning_rate)

# 3) Vòng lặp huấn luyện
for epoch in range(num_epochs):
    # Tính toán (forward pass) và mất mát
    y_pred = model(X_train)
    loss = criterion(y_pred, y_train)

    # Lan truyền ngược (backward pass) và cập nhật tham số
    loss.backward()
    optimizer.step()

    # Xóa gradient trước khi bước lặp mới
    optimizer.zero_grad()

    if (epoch + 1) % 10 == 0:
        print(f'Epoch: {epoch+1}, Loss = {loss.item():.4f}')

# Đánh giá trên tập kiểm tra
with torch.no_grad():
    y_predicted = model(X_test)  # Dự đoán xác suất
    y_predicted_cls = y_predicted.round()  # Làm tròn để phân loại (0 hoặc 1)
    acc = y_predicted_cls.eq(y_test).sum() / float(y_test.shape[0])  # Tính độ chính xác
    print(f'Dộ chính xác: {acc.item():.4f}')

Giải thích từng phần

Bước 0: Chuẩn bị dữ liệu

  • Dữ liệu Breast Cancer có 569 mẫu và 30 đặc trưng.
  • Các đặc trưng được chuẩn hóa bằng StandardScaler để đảm bảo mọi giá trị đầu vào có cùng quy mô.
  • Dữ liệu được chia thành:
    • Tập huấn luyện (80% dữ liệu) để dạy mô hình.
    • Tập kiểm tra (20% dữ liệu) để đánh giá hiệu năng sau khi mô hình đã học.

Bước 1: Thiết kế mô hình

  • Mô hình hồi quy logistic sử dụng lớp tuyến tính wx+bwx + b để tính toán giá trị dự đoán.
  • Hàm kích hoạt sigmoid được thêm vào đầu ra của mô hình, chuyển giá trị dự đoán thành xác suất trong khoảng [0,1][0, 1].

Bước 2: Định nghĩa hàm mất mát và trình tối ưu hóa

  • Hàm mất mát (BCELoss):
    Binary Cross-Entropy Loss xử lý bài toán phân loại nhị phân, tính toán mức độ "khớp" giữa xác suất dự đoán và nhãn thực tế.
  • Trình tối ưu hóa (SGD):
    Sử dụng thuật toán gradient descent ngẫu nhiên để cập nhật trọng số dựa trên gradient của hàm mất mát.

Bước 3: Huấn luyện mô hình

  • Trong mỗi epoch:
    1. Forward pass: Dự đoán xác suất với tập huấn luyện.
    2. Backward pass: Tính gradient của lỗi theo các tham số.
    3. Cập nhật tham số: Trình tối ưu hóa điều chỉnh trọng số ww và bias bb.
    4. Xóa gradient: Đặt lại gradient trước khi bước lặp tiếp theo.

Bước 4: Kiểm tra độ chính xác

  • Với dữ liệu kiểm tra, mô hình dự đoán xác suất, sau đó làm tròn y^\hat{y} về 0 hoặc 1.
  • Đo lường độ chính xác dựa trên tỷ lệ dự đoán đúng so với tổng mẫu.

Kết quả mong đợi

  • Quá trình huấn luyện:
    Mất mát giảm dần sau mỗi epoch, ví dụ:
Epoch: 10, Loss = 0.5432  
Epoch: 20, Loss = 0.4321  
...  
Epoch: 100, Loss = 0.2134  
  • Độ chính xác:
    Ví dụ, mô hình có thể đạt được độ chính xác 95%\approx 95\% trên tập kiểm tra.

Kết bài

Mô hình hồi quy logistic đơn giản này minh họa quy trình cơ bản của học sâu với PyTorch. Từ đây, bạn có thể mở rộng sang các bài toán phức tạp hơn như:

  • Phân loại đa nhãn (multi-class classification).
  • Kết hợp với các kỹ thuật tăng cường hiệu năng như điều chỉnh tham số (hyperparameter tuning).

Hồi quy logistic không chỉ mạnh mẽ mà còn dễ hiểu, là bước đệm quan trọng để đi sâu vào học sâu (deep learning).

Bài viết này được đăng tại [free tuts .net]

Cùng chuyên mục:

Hồi quy tuyến tính trong PyTorch Beginner

Hồi quy tuyến tính trong PyTorch Beginner

Training Pipeline trong PyTorch Beginner

Training Pipeline trong PyTorch Beginner

Sử dụng Gradient Descent với Autograd trong PyTorch

Sử dụng Gradient Descent với Autograd trong PyTorch

Hướng dẫn về Tensor cơ bản trong PyTorch

Hướng dẫn về Tensor cơ bản trong PyTorch

Hướng dẫn cài đặt PyTorch với Deep Learning

Hướng dẫn cài đặt PyTorch với Deep Learning

LDA (Linear Discriminant Analysis) trong Python

LDA (Linear Discriminant Analysis) trong Python

Thuật toán AdaBoost trong Python

Thuật toán AdaBoost trong Python

Thuật toán K-Means Clustering trong Python

Thuật toán K-Means Clustering trong Python

Triển khai PCA bằng Python

Triển khai PCA bằng Python

Triển khai thuật toán Random Forest bằng Python

Triển khai thuật toán Random Forest bằng Python

Triển khai Decision Tree bằng Python

Triển khai Decision Tree bằng Python

SVM (Support Vector Machine) bằng Python

SVM (Support Vector Machine) bằng Python

Bắt đầu tìm hiểu Perceptron bằng Python

Bắt đầu tìm hiểu Perceptron bằng Python

Thuật toán Naive Bayes trong Python

Thuật toán Naive Bayes trong Python

Hồi quy tuyến tính và hồi quy Logistic trong Python

Hồi quy tuyến tính và hồi quy Logistic trong Python

Hồi Quy Logistic (Logistic Regression) trong Python

Hồi Quy Logistic (Logistic Regression) trong Python

Hồi quy tuyến tính (Linear Regression) trong Python

Hồi quy tuyến tính (Linear Regression) trong Python

KNN (K Nearest Neighbors) trong Python

KNN (K Nearest Neighbors) trong Python

Hướng dẫn sử dụng Anaconda bằng Python

Hướng dẫn sử dụng Anaconda bằng Python

Hướng dẫn Web Scraping tự động tải hình ảnh với Python

Hướng dẫn Web Scraping tự động tải hình ảnh với Python

Top