Thông báo: Download 4 khóa học Python từ cơ bản đến nâng cao tại đây.
Cắt Chuỗi (Slicing) trong Python
Cắt chuỗi (slicing) là một kỹ thuật quan trọng và hữu ích cho phép bạn trích xuất và gán dữ liệu vào các chuỗi (sequences) một cách dễ dàng và hiệu quả. Kỹ thuật này không chỉ áp dụng cho các danh sách (lists) mà còn có thể sử dụng với các chuỗi dữ liệu khác như chuỗi ký tự (strings) và bộ dữ liệu (tuples). Hiểu rõ và nắm vững cách sử dụng cắt chuỗi sẽ giúp bạn thao tác với dữ liệu một cách linh hoạt và nhanh chóng, tối ưu hóa quá trình xử lý và quản lý dữ liệu trong các dự án lập trình của mình. Trong bài viết này, mình sẽ tìm hiểu chi tiết về cắt chuỗi trong Python, từ những nguyên tắc cơ bản đến những ứng dụng phức tạp hơn, giúp bạn có cái nhìn sâu sắc và toàn diện về kỹ thuật quan trọng này.
Ôn tập về cắt chuỗi trong Python
Trước tiên, bạn đã học về cắt chuỗi, chẳng hạn như cắt chuỗi trong list.
Về mặt kỹ thuật, cắt chuỗi dựa vào chỉ mục (indexing). Do đó, cắt chuỗi chỉ hoạt động với các loại chuỗi (sequence types).
Đối với các loại chuỗi có thể thay đổi như list, bạn có thể sử dụng cắt chuỗi để trích xuất và gán dữ liệu. Ví dụ:
Bài viết này được đăng tại [free tuts .net]
colors = ['red', 'green', 'blue', 'orange'] # Trích xuất dữ liệu print(colors[1:3]) # Gán dữ liệu colors[1:3] = ['pink', 'black'] print(colors)
Kết quả:
['green', 'blue'] ['red', 'pink', 'black', 'orange']
Tuy nhiên, bạn cũng có thể sử dụng cắt chuỗi để trích xuất dữ liệu từ các chuỗi bất biến. Ví dụ:
topic = 'Python Slicing' # Trích xuất dữ liệu print(topic[0:6])
Kết quả:
Python
Nếu bạn cố gắng sử dụng cắt chuỗi để gán dữ liệu cho một chuỗi bất biến, bạn sẽ gặp lỗi. Ví dụ:
topic[0:6] = 'Java'
Lỗi:
TypeError: 'str' object does not support item assignment
Nguyên tắc hoạt động của cắt chuỗi
Cú pháp cắt chuỗi seq[start:stop]
trả về các phần tử bắt đầu từ chỉ mục start
đến chỉ mục stop - 1
. Do đó, dễ hình dung rằng các chỉ mục nằm giữa các phần tử khi bạn cắt chuỗi.
Kiểu cắt chuỗi (slice type) trong Python
Mọi thứ trong Python đều là đối tượng, bao gồm cả cắt chuỗi. Một cắt chuỗi thực chất là một đối tượng của kiểu slice. Khi bạn sử dụng cú pháp cắt chuỗi:
seq[start:stop]
Phần start:stop
là một đối tượng slice.
slice(start, stop)
Ví dụ:
s = slice(1, 3) print(type(s)) print(s.start, s.stop)
Kết quả:
<class 'slice'> 1 3
Thay vì sử dụng cú pháp cắt chuỗi:
colors[1:3]
... bạn có thể sử dụng đối tượng slice thay thế:
colors = ['red', 'green', 'blue', 'orange'] s = slice(1, 3) print(colors[s])
Kết quả:
['green', 'blue']
Cắt chuỗi giới hạn start và stop trong Python
Cắt chuỗi seq[start:stop]
chọn các phần tử bắt đầu từ chỉ mục start
và kết thúc tại chỉ mục stop
(không bao gồm phần tử tại chỉ mục stop
).
Nói cách khác, nó trả về tất cả các phần tử của chuỗi tại chỉ mục n
nơi n
thỏa mãn biểu thức sau:
start <= n < stop
Khi start
hoặc stop
lớn hơn độ dài của chuỗi:
len(seq)
... Python sẽ sử dụng len(seq)
cho start
hoặc stop
.
Cả start
và stop
đều không bắt buộc. start
mặc định là 0 và stop
mặc định là len(seq)
khi bạn không chỉ định nó.
Ví dụ sau đây trả về toàn bộ list:
colors = ['red', 'green', 'blue', 'orange'] print(colors[0:100])
Kết quả:
['red', 'green', 'blue', 'orange']
Vì giới hạn stop
là 100, Python sử dụng len(colors)
cho giới hạn stop
.
Ví dụ sau đây trả về một list rỗng:
colors = ['red', 'green', 'blue', 'orange'] print(colors[10:])
Vì start
là 10, Python gán len(colors)
cho nó.
Giới hạn âm cho start và stop
Đối tượng slice cũng chấp nhận giới hạn start
và stop
âm. Ví dụ sau đây sử dụng giới hạn âm để cắt một list:
colors = ['red', 'green', 'blue', 'orange'] print(colors[-4:-2])
Kết quả:
['red', 'green']
Để lấy các phần tử 'blue' và 'orange' từ list colors, bạn có thể kết hợp các giới hạn âm và dương:
colors = ['red', 'green', 'blue', 'orange'] print(colors[-2:4])
Kết quả:
['blue', 'orange']
Giá trị bước (step value)
Slices hỗ trợ đối số thứ ba, đó là giá trị bước (step value). Giá trị bước mặc định là 1 nếu bạn không chỉ định nó:
seq[start:stop:step]
Nó tương đương với:
s = slice(start, stop, step) seq[s]
Xem ví dụ sau:
colors = ['red', 'green', 'blue', 'orange'] print(colors[0:4:2])
Kết quả:
['red', 'blue']
Phương thức indices
Một đối tượng slice về cơ bản xác định một chuỗi các chỉ mục để chọn các phần tử của một chuỗi.
Để tiện lợi hơn, kiểu slice có phương thức indices trả về khoảng tương đương (start, stop, step) cho bất kỳ slice nào của một chuỗi có độ dài xác định:
slice(start, stop, step).indices(length)
Nó trả về một tuple mới:
(i, j, k)
Bạn có thể sử dụng các giá trị của tuple này để tạo ra một danh sách các chỉ mục bằng cách sử dụng hàm range. Ví dụ:
colors = ['red', 'green', 'blue', 'orange'] s = slice(0, 4, 2) t = s.indices(len(colors)) for index in range(*t): print(colors[index])
Kết quả:
red blue
Kết bài
Qua bài viết này, mình đã tìm hiểu cách cắt chuỗi trong Python và những ứng dụng của kỹ thuật này. Điều quan trọng cần nhớ là cắt chuỗi chỉ hoạt động với các loại chuỗi, bao gồm cả chuỗi có thể thay đổi (như list) và chuỗi bất biến (như string và tuple). Một slice trong Python thực chất là một đối tượng của kiểu slice, cho phép mình linh hoạt trong việc thao tác với dữ liệu. Hiểu rõ và sử dụng thành thạo cắt chuỗi sẽ giúp bạn làm việc với dữ liệu một cách hiệu quả và tinh gọn hơn trong các dự án lập trình.