CÔNG CỤ
MODULES
THAM KHẢO
Cách chia List thành các phần bằng nhau trong Python Cách xóa một khóa (key) ra khỏi dictionary trong Python Hướng dẫn chuyển đổi file Google Colab sang Markdown trong Python Bài tập Python: Lập trình cơ sở dữ liệu trong Python Kết nối cơ sở dữ liệu MySQL Python Hướng dẫn kết nối Python PostgreSQL bằng Psycopg2 Hướng dẫn kết nối SQLite sử dụng sqlite3 trong Python Bài tập Python : Pandas trong Python Phạm vi số float của Python Cách lên lịch chạy script Python bằng GitHub Actions Cách tạo hằng số trong Python Các nền tảng lưu trữ tốt nhất cho ứng dụng và script Python 6 Tip viết vòng lặp For hiệu quả hơn trong Python Cách đảo ngược Chuỗi String trong Python Cách gỡ lỗi ứng dụng Python trong Docker Container bằng VS Code 10 tip One Liner bạn cần biết trong Python Cách áp dụng ngưỡng hình ảnh trong Python với NumPy Tìm hiểu về các phép toán Groupby trong Pandas Lập trình Socket trong Python Mô-đun base64 trong Python Cách giới hạn float values trong Python Tìm hiểu Mô-đun statistics Trong Python File Organizing trong Python Đổi tên File trong Python Tìm hiểu về Deque trong Python Mô-đun Calendar trong Python Tìm hiểu về Enum trong Python Sử dụng pprint trong Python Làm việc với cấu trúc Dữ liệu Stack trong Python Thư viện functools trong Python Tip sử dụng hàm round() với tham số âm trong Python Hàm print có thể nhận thêm các tham số bổ sung trong Python Tip tìm chuỗi dài nhất bằng hàm max() trong Python Cách lặp qua nhiều list với hàm zip() trong Python Tìm hiểu về MLOps trong Python Docker và Kubernetes với MLOps trong Python Kết hợp DevOps với MLOps trong Python Xử lý độ chính xác các hàm floor, ceil, round, trunc, format trong Python tối ưu quy trình MLOps Với Python Sự khác biệt giữa byte objects và string trong Python Top 4 thư viện phổ biến nhất của NLP trong Python Cách sử dụng ThreadPoolExecutor trong Python Phân tích dữ liệu Blockchain với Python Hướng dẫn triển khai Smart Contracts với Python Blockchain APIs với Python Làm việc với file ZIP trong Python Sự khác biệt giữa toán tử == và is trong Python Chuyển đổi kiểu dữ liệu trong Python Cách làm việc với file tarball/tar trong Python Sự khác biệt giữa iterator và iterable trong Python Sự khác biệt giữa set() và frozenset() trong Python Làm việc với các biến môi trường trong Python Một tác vụ phổ biến khi làm việc với danh sách trong Python Định dạng chuỗi Strings trong Python Sử dụng Poetry để quản lý dependencies trong Python Sự khác biệt giữa sort() và sorted() trong Python Từ khóa yield trong Python Lớp dữ liệu (Data Classes) trong Python với decorator @dataclass Cách truy cập và thiết lập biến môi trường trong Python Hướng dẫn toàn diện về module datetime trong Python Hướng dẫn xây dựng Command-Line Interface (CLI) bằng Quo trong Python Sử dụng Virtual Environment trong Python Từ khóa super() trong Python Số phức trong Python Ý nghĩa của một hoặc hai dấu gạch dưới đứng đầu trong Python Làm việc với Video trong OpenCV bằng Python Chỉnh sửa file trực tiếp bằng module fileinput trong Python Hướng dẫn cách chuyển đổi kiểu dữ liệu trong Python Làm việc với hình ảnh trong OpenCV sử dụng Python Metaclasses trong Python Cách chọn ngẫu nhiên một phần tử từ danh sách trong Python Hướng dẫn cài đặt và sử dụng OpenCV trong Python Phạm vi toàn cục, cục bộ và không cục bộ trong Python Tìm hiểu về từ khóa self trong các lớp Python Hướng dẫn sử dụng Rich, Typer, và SQLite trên terminal bằng Python Giới thiệu về Graph Machine Learning trong Python Cách kiểm tra một đối tượng có thể lặp (iterable) trong Python Quản lý sinh viên Python & MySQL Cách cắt (slicing) chuỗi trong Python Cách loại bỏ phần tử trùng lặp khỏi danh sách (List) trong Python Phân tích dữ liệu Apple Health bằng Python Cách làm phẳng danh sách lồng nhau trong Python Tìm hiểu về *args và **kwargs trong Python Cách xóa file và thư mục trong Python 31 Phương thức xử lý chuỗi (String) quan trọng trong Python Cách sao chép file trong Python 8 Mẹo Refactor Code Python nhanh gọn (Phần 2) Cách yêu cầu người dùng nhập liệu đến khi nhận được phản hồi hợp lệ trong Python Làm chủ Pattern Matching trong Python 3.10 Tạo app ghi chú trong Python với nhận dạng giọng nói và API Notion Các tính năng mới trong Python 3.10 5 lỗi thường gặp trong Python Sự khác biệt giữa append() và extend() trong list Python Các cách nối hai danh sách trong Python Sự khác biệt giữa str và repr trong Python Sự khác biệt giữa @classmethod, @staticmethod và instance methods trong Python Cách thêm số 0 vào đầu chuỗi trong Python Cách tạo thư mục lồng nhau (nested directory) trong Python
CÁC CHỦ ĐỀ
BÀI MỚI NHẤT
MỚI CẬP NHẬT

Thông báo: Download 4 khóa học Python từ cơ bản đến nâng cao tại đây.

Phân tích dữ liệu Apple Health bằng Python

Bài viết này hướng dẫn cách sử dụng Python để phân tích dữ liệu từ ứng dụng Apple Health, bao gồm:

test php

banquyen png
Bài viết này được đăng tại freetuts.net, không được copy dưới mọi hình thức.
  • Nạp dữ liệu bài tập từ file XML vào Pandas DataFrame.
  • Trích xuất các thống kê như thời gian tập và lượng calo tiêu thụ.
  • Phân tích, vẽ biểu đồ dữ liệu nhịp tim.
  • Lọc bài tập theo loại hoặc khoảng thời gian.
  • Tạo biểu đồ tròn để hiển thị phần trăm các loại bài tập.

Cách sử dụng Python để phân tích dữ liệu từ ứng dụng Apple Health

Lấy dữ liệu từ Apple Health

Trên iPhone, vào ứng dụng Health App:
ProfileExport Data → Gửi file đến máy tính.

File sẽ được xuất dưới dạng Export.zip. Giải nén file này, sau đó đặt file Export.xml vào thư mục con có tên data trong dự án. Các file khác có thể bỏ qua.

Cài đặt các thư viện cần thiết

Dự án yêu cầu hai thư viện chính là PandasMatplotlib. Cài đặt bằng pip:

pip install pandas matplotlib

Nạp dữ liệu XML vào Python

Tạo file Python mới (hoặc sử dụng Jupyter Notebook) và import dữ liệu:

Bài viết này được đăng tại [free tuts .net]

import xml.etree.ElementTree as ET
import pandas as pd
import datetime as dt
import matplotlib.pyplot as plt

plt.style.use("fivethirtyeight")

# Tạo đối tượng ElementTree và nạp dữ liệu XML
tree = ET.parse('data/Export.xml') 
root = tree.getroot()

# Lấy tất cả các bản ghi từ file
record_list = [x.attrib for x in root.iter('Record')]

Tạo DataFrame từ Pandas

Chuyển đổi danh sách dữ liệu thành DataFrame và điều chỉnh kiểu dữ liệu:

record_data = pd.DataFrame(record_list)

# Định dạng các cột ngày tháng
for col in ['creationDate', 'startDate', 'endDate']:
    record_data[col] = pd.to_datetime(record_data[col])

# Chuyển cột 'value' thành số, giá trị lỗi sẽ thành NaN
record_data['value'] = pd.to_numeric(record_data['value'], errors='coerce')

# Điền giá trị NaN thành 1.0 để dễ dàng xử lý
record_data['value'] = record_data['value'].fillna(1.0)

# Rút gọn tên loại quan sát
record_data['type'] = record_data['type'].str.replace('HKQuantityTypeIdentifier', '')
record_data['type'] = record_data['type'].str.replace('HKCategoryTypeIdentifier', '')

record_data.tail()

recorddata png

Trích xuất dữ liệu bài tập

Tạo một DataFrame riêng cho dữ liệu bài tập:

workout_list = [x.attrib for x in root.iter('Workout')]

workout_data = pd.DataFrame(workout_list)

# Rút gọn tên loại bài tập
workout_data['workoutActivityType'] = workout_data['workoutActivityType'].str.replace('HKWorkoutActivityType', '')
workout_data = workout_data.rename({"workoutActivityType": "Type"}, axis=1)

# Chuyển đổi kiểu dữ liệu
for col in ['creationDate', 'startDate', 'endDate']:
    workout_data[col] = pd.to_datetime(workout_data[col])

workout_data['duration'] = pd.to_numeric(workout_data['duration'])
workout_data['totalEnergyBurned'] = pd.to_numeric(workout_data['totalEnergyBurned'])
workout_data['totalDistance'] = pd.to_numeric(workout_data['totalDistance'])

workout_data.tail()

workoutdata png

Phân tích dữ liệu bài tập

Số lượng bài tập

num_workouts = workout_data.shape[0]
print(f"Số lượng bài tập: {num_workouts}")

Lọc bài tập theo loại

def get_workouts(df, workout_type):
    return df[df["Type"] == workout_type]

print(workout_data.Type.unique())  # Liệt kê các loại bài tập
running_data = get_workouts(workout_data, "Running")

Lọc bài tập theo khoảng thời gian

def get_workouts_from_to(df, start, end):
    start = pd.to_datetime(start, utc=True)
    end = pd.to_datetime(end, utc=True)
    workouts = df[df["creationDate"] >= start]
    workouts = workouts[workouts["creationDate"] <= end]
    return workouts

lower_time = dt.date(2021, 1, 1)
upper_time = dt.date(2022, 1, 1)
workouts = get_workouts_from_to(workout_data, lower_time, upper_time)

Phân tích nhịp tim

Trích xuất dữ liệu nhịp tim và tính toán thống kê:

heartrate_data = record_data[record_data["type"] == "HeartRate"]

def get_heartrate_for_workout(heartrate, workout):
    def get_heartrate_for_date(hr, start, end):
        hr = hr[hr["startDate"] >= start]
        hr = hr[hr["endDate"] <= end]
        return hr
    return get_heartrate_for_date(heartrate, workout["startDate"].item(), workout["endDate"].item())

last_workout = workouts.iloc[[-1]]
heartrate_workout = get_heartrate_for_workout(heartrate_data, last_workout)

minh = heartrate_workout["value"].min()
maxh = heartrate_workout["value"].max()
meanh = heartrate_workout["value"].mean()

print(f"Loại bài tập: {last_workout.Type.item()}, Nhịp tim thấp nhất: {minh}, Cao nhất: {maxh}, Trung bình: {meanh}")

hr png

Vẽ biểu đồ bài tập

Biểu đồ tròn hiển thị phần trăm các loại bài tập:

def plot_workouts(workouts):
    labels = []
    slices = []
    for wo_type in workouts.Type.unique():
        labels.append(wo_type)
        wo_of_type = workouts[workouts["Type"] == wo_type]
        slices.append(wo_of_type.shape[0])

    def make_autopct(values):
        def my_autopct(pct):
            total = sum(values)
            val = int(round(pct*total/100.0))
            return f'{pct:.2f}% ({val})'
        return my_autopct

    plt.figure(figsize=(10, 10))
    plt.pie(slices, labels=labels, shadow=True, startangle=90, autopct=make_autopct(slices), wedgeprops={'edgecolor': 'black'})
    plt.title("Phân bố bài tập năm 2021")
    plt.tight_layout()
    plt.show()

plot_workouts(workouts)

Thống kê tổng quan

def get_stats(workouts):
    total_kcal = workouts["totalEnergyBurned"].sum()
    total_dist = workouts["totalDistance"].sum()
    total_time = workouts["duration"].sum()

    print(f"Số bài tập: {workouts.shape[0]}")
    print(f"Tổng thời gian: {total_time:.2f} phút")
    print(f"Lượng calo tiêu thụ: {total_kcal:.2f} kcal")
    print(f"Tổng quãng đường chạy: {total_dist:.2f} km")

get_stats(workouts)

workoutpie png

​Kết bài

Qua bài viết này, bạn đã học cách sử dụng Python để phân tích dữ liệu từ Apple Health, từ việc nạp dữ liệu, xử lý và trích xuất thông tin quan trọng, đến việc trực quan hóa bằng biểu đồ. Những kỹ thuật này không chỉ giúp bạn hiểu rõ hơn về thói quen tập luyện của mình mà còn cung cấp góc nhìn sâu sắc hơn để cải thiện sức khỏe và hiệu suất.

Hãy thử áp dụng phương pháp này với dữ liệu cá nhân của bạn để theo dõi tiến bộ và đặt mục tiêu cho tương lai. Python không chỉ là công cụ mạnh mẽ cho phân tích dữ liệu mà còn là "người đồng hành" hiệu quả trên hành trình nâng cao sức khỏe.

Cùng chuyên mục:

Cách tạo thư mục lồng nhau (nested directory) trong Python

Cách tạo thư mục lồng nhau (nested directory) trong Python

Cách thêm số 0 vào đầu chuỗi trong Python

Cách thêm số 0 vào đầu chuỗi trong Python

Sự khác biệt giữa @classmethod, @staticmethod và instance methods trong Python

Sự khác biệt giữa @classmethod, @staticmethod và instance methods trong Python

Sự khác biệt giữa str và repr trong Python

Sự khác biệt giữa str và repr trong Python

Các cách nối hai danh sách trong Python

Các cách nối hai danh sách trong Python

Sự khác biệt giữa append() và extend() trong list Python

Sự khác biệt giữa append() và extend() trong list Python

5 lỗi thường gặp trong Python

5 lỗi thường gặp trong Python

Các tính năng mới trong Python 3.10

Các tính năng mới trong Python 3.10

Tạo app ghi chú trong Python với nhận dạng giọng nói và API Notion

Tạo app ghi chú trong Python với nhận dạng giọng nói và API Notion

Làm chủ Pattern Matching trong Python 3.10

Làm chủ Pattern Matching trong Python 3.10

Cách yêu cầu người dùng nhập liệu đến khi nhận được phản hồi hợp lệ trong Python

Cách yêu cầu người dùng nhập liệu đến khi nhận được phản hồi hợp lệ trong Python

8 Mẹo Refactor Code Python nhanh gọn (Phần 2)

8 Mẹo Refactor Code Python nhanh gọn (Phần 2)

Cách sao chép file trong Python

Cách sao chép file trong Python

31 Phương thức xử lý chuỗi (String) quan trọng trong Python

31 Phương thức xử lý chuỗi (String) quan trọng trong Python

Cách xóa file và thư mục trong Python

Cách xóa file và thư mục trong Python

Tìm hiểu về *args và **kwargs trong Python

Tìm hiểu về *args và **kwargs trong Python

Cách làm phẳng danh sách lồng nhau trong Python

Cách làm phẳng danh sách lồng nhau trong Python

Cách loại bỏ phần tử trùng lặp khỏi danh sách (List) trong Python

Cách loại bỏ phần tử trùng lặp khỏi danh sách (List) trong Python

Cách cắt (slicing) chuỗi trong Python

Cách cắt (slicing) chuỗi trong Python

Cách kiểm tra một đối tượng có thể lặp (iterable) trong Python

Cách kiểm tra một đối tượng có thể lặp (iterable) trong Python

Top