CÔNG CỤ
MODULES
THAM KHẢO
CÁC CHỦ ĐỀ
BÀI MỚI NHẤT
MỚI CẬP NHẬT

Thông báo: Download 4 khóa học Python từ cơ bản đến nâng cao tại đây.

Cắt Chuỗi (Slicing) trong Python

Cắt chuỗi (slicing) là một kỹ thuật quan trọng và hữu ích cho phép bạn trích xuất và gán dữ liệu vào các chuỗi (sequences) một cách dễ dàng và hiệu quả. Kỹ thuật này không chỉ áp dụng cho các danh sách (lists) mà còn có thể sử dụng với các chuỗi dữ liệu khác như chuỗi ký tự (strings) và bộ dữ liệu (tuples). Hiểu rõ và nắm vững cách sử dụng cắt chuỗi sẽ giúp bạn thao tác với dữ liệu một cách linh hoạt và nhanh chóng, tối ưu hóa quá trình xử lý và quản lý dữ liệu trong các dự án lập trình của mình. Trong bài viết này, mình sẽ tìm hiểu chi tiết về cắt chuỗi trong Python, từ những nguyên tắc cơ bản đến những ứng dụng phức tạp hơn, giúp bạn có cái nhìn sâu sắc và toàn diện về kỹ thuật quan trọng này.

test php

banquyen png
Bài viết này được đăng tại freetuts.net, không được copy dưới mọi hình thức.

Ôn tập về cắt chuỗi trong Python

Trước tiên, bạn đã học về cắt chuỗi, chẳng hạn như cắt chuỗi trong list.

Về mặt kỹ thuật, cắt chuỗi dựa vào chỉ mục (indexing). Do đó, cắt chuỗi chỉ hoạt động với các loại chuỗi (sequence types).

Đối với các loại chuỗi có thể thay đổi như list, bạn có thể sử dụng cắt chuỗi để trích xuất và gán dữ liệu. Ví dụ:

Bài viết này được đăng tại [free tuts .net]

colors = ['red', 'green', 'blue', 'orange']

# Trích xuất dữ liệu
print(colors[1:3])

# Gán dữ liệu
colors[1:3] = ['pink', 'black']
print(colors)

Kết quả:

['green', 'blue']
['red', 'pink', 'black', 'orange']

Tuy nhiên, bạn cũng có thể sử dụng cắt chuỗi để trích xuất dữ liệu từ các chuỗi bất biến. Ví dụ:

topic = 'Python Slicing'

# Trích xuất dữ liệu
print(topic[0:6])

Kết quả:

Python

Nếu bạn cố gắng sử dụng cắt chuỗi để gán dữ liệu cho một chuỗi bất biến, bạn sẽ gặp lỗi. Ví dụ:

topic[0:6] = 'Java'

Lỗi:

TypeError: 'str' object does not support item assignment

Nguyên tắc hoạt động của cắt chuỗi

Cú pháp cắt chuỗi seq[start:stop] trả về các phần tử bắt đầu từ chỉ mục start đến chỉ mục stop - 1. Do đó, dễ hình dung rằng các chỉ mục nằm giữa các phần tử khi bạn cắt chuỗi.

Screenshot 202024 07 02 20222838 png

Kiểu cắt chuỗi (slice type) trong Python

Mọi thứ trong Python đều là đối tượng, bao gồm cả cắt chuỗi. Một cắt chuỗi thực chất là một đối tượng của kiểu slice. Khi bạn sử dụng cú pháp cắt chuỗi:

seq[start:stop]

Phần start:stop là một đối tượng slice.

slice(start, stop)

Ví dụ:

s = slice(1, 3)

print(type(s))
print(s.start, s.stop)

Kết quả:

<class 'slice'>
1 3

Thay vì sử dụng cú pháp cắt chuỗi:

colors[1:3]

... bạn có thể sử dụng đối tượng slice thay thế:

colors = ['red', 'green', 'blue', 'orange']
s = slice(1, 3)

print(colors[s])

Kết quả:

['green', 'blue']

Cắt chuỗi giới hạn start và stop trong Python

Cắt chuỗi seq[start:stop] chọn các phần tử bắt đầu từ chỉ mục start và kết thúc tại chỉ mục stop (không bao gồm phần tử tại chỉ mục stop).

Nói cách khác, nó trả về tất cả các phần tử của chuỗi tại chỉ mục n nơi n thỏa mãn biểu thức sau:

start <= n < stop

Khi start hoặc stop lớn hơn độ dài của chuỗi:

len(seq)

... Python sẽ sử dụng len(seq) cho start hoặc stop.

Cả startstop đều không bắt buộc. start mặc định là 0 và stop mặc định là len(seq) khi bạn không chỉ định nó.

Ví dụ sau đây trả về toàn bộ list:

colors = ['red', 'green', 'blue', 'orange']
print(colors[0:100])

Kết quả:

['red', 'green', 'blue', 'orange']

Vì giới hạn stop là 100, Python sử dụng len(colors) cho giới hạn stop.

Ví dụ sau đây trả về một list rỗng:

colors = ['red', 'green', 'blue', 'orange']
print(colors[10:])

start là 10, Python gán len(colors) cho nó.

Giới hạn âm cho start và stop

Đối tượng slice cũng chấp nhận giới hạn startstop âm. Ví dụ sau đây sử dụng giới hạn âm để cắt một list:

colors = ['red', 'green', 'blue', 'orange']

print(colors[-4:-2])

Kết quả:

['red', 'green']

Để lấy các phần tử 'blue' và 'orange' từ list colors, bạn có thể kết hợp các giới hạn âm và dương:

colors = ['red', 'green', 'blue', 'orange']
print(colors[-2:4])

Kết quả:

['blue', 'orange']

Screenshot 202024 07 02 20222856 png

Giá trị bước (step value)

Slices hỗ trợ đối số thứ ba, đó là giá trị bước (step value). Giá trị bước mặc định là 1 nếu bạn không chỉ định nó:

seq[start:stop:step]

Nó tương đương với:

s = slice(start, stop, step) 
seq[s]

Xem ví dụ sau:

colors = ['red', 'green', 'blue', 'orange']
print(colors[0:4:2])

Kết quả:

['red', 'blue']

Phương thức indices

Một đối tượng slice về cơ bản xác định một chuỗi các chỉ mục để chọn các phần tử của một chuỗi.

Để tiện lợi hơn, kiểu slice có phương thức indices trả về khoảng tương đương (start, stop, step) cho bất kỳ slice nào của một chuỗi có độ dài xác định:

slice(start, stop, step).indices(length)

Nó trả về một tuple mới:

(i, j, k)

Bạn có thể sử dụng các giá trị của tuple này để tạo ra một danh sách các chỉ mục bằng cách sử dụng hàm range. Ví dụ:

colors = ['red', 'green', 'blue', 'orange']

s = slice(0, 4, 2)
t = s.indices(len(colors))

for index in range(*t):
    print(colors[index])

Kết quả:

red
blue

Kết bài

Qua bài viết này, mình đã tìm hiểu cách cắt chuỗi trong Python và những ứng dụng của kỹ thuật này. Điều quan trọng cần nhớ là cắt chuỗi chỉ hoạt động với các loại chuỗi, bao gồm cả chuỗi có thể thay đổi (như list) và chuỗi bất biến (như string và tuple). Một slice trong Python thực chất là một đối tượng của kiểu slice, cho phép mình linh hoạt trong việc thao tác với dữ liệu. Hiểu rõ và sử dụng thành thạo cắt chuỗi sẽ giúp bạn làm việc với dữ liệu một cách hiệu quả và tinh gọn hơn trong các dự án lập trình.

Cùng chuyên mục:

Tìm hiểu về Multithreading trong Python

Tìm hiểu về Multithreading trong Python

Cách trả về giá trị từ một Thread trong Python

Cách trả về giá trị từ một Thread trong Python

Cách mở rộng Class Thread trong Python

Cách mở rộng Class Thread trong Python

Cách sử dụng module threading trong Python

Cách sử dụng module threading trong Python

Sự khác biệt giữa các Processes and Threads

Sự khác biệt giữa các Processes and Threads

Tài liệu tham khảo nhanh về Regex trong Python

Tài liệu tham khảo nhanh về Regex trong Python

Hàm Flags của Regex trong Python

Hàm Flags của Regex trong Python

Hàm split() của Regex trong Python

Hàm split() của Regex trong Python

Hàm finditer() của Regex trong Python

Hàm finditer() của Regex trong Python

Hàm fullmatch() của Regex trong Python

Hàm fullmatch() của Regex trong Python

Hàm match() của Regex trong Python

Hàm match() của Regex trong Python

Hàm sub() của Regex trong Python

Hàm sub() của Regex trong Python

Hàm search() trong Python Regex

Hàm search() trong Python Regex

Hàm findall() của regex trong Python

Hàm findall() của regex trong Python

Lookbehind trong Regex của Python

Lookbehind trong Regex của Python

Lookahead trong Python Regex

Lookahead trong Python Regex

Alternation Regex trong Python

Alternation Regex trong Python

Tìm hiểu Backreferences trong regex của Python

Tìm hiểu Backreferences trong regex của Python

Nhóm Non-capturing trong Regex Python

Nhóm Non-capturing trong Regex Python

Các nhóm Capturing trong regex của Python

Các nhóm Capturing trong regex của Python

Top