Thông báo: Download 4 khóa học Python từ cơ bản đến nâng cao tại đây.
Các sequence trong Python
Trong bài viết này, bạn sẽ tìm các loại sequence trong Python và các thao tác cơ bản có thể thực hiện trên chúng. Sequence là một khái niệm quan trọng trong lập trình Python, cho phép bạn làm việc với các tập hợp phần tử theo cách có tổ chức và dễ dàng truy xuất. Bằng cách nắm vững các thao tác như đếm phần tử, kiểm tra sự tồn tại của phần tử, tìm chỉ số, cắt đoạn, và nhiều thao tác khác, bạn sẽ có khả năng xử lý dữ liệu một cách hiệu quả và chính xác hơn trong các ứng dụng Python của mình.
Giới thiệu về các sequence trong Python
Sequence là một tập hợp các phần tử được sắp xếp theo thứ tự vị trí. Bạn có thể tham chiếu đến bất kỳ phần tử nào trong sequence bằng cách sử dụng chỉ số của nó, ví dụ như s[0]
và s[1]
.
Trong Python, chỉ số của sequence bắt đầu từ 0, không phải 1. Do đó, phần tử đầu tiên là s[0]
và phần tử thứ hai là s[1]
. Nếu sequence s
có n
phần tử, phần tử cuối cùng sẽ là s[n-1]
.
Python có các loại sequence tích hợp sau: list, bytearray, string, tuple, range, và byte. Python phân loại các sequence thành hai loại: có thể thay đổi (mutable) và không thể thay đổi (immutable).
Bài viết này được đăng tại [free tuts .net]
Các loại sequence có thể thay đổi bao gồm list và bytearray, trong khi các loại sequence không thể thay đổi bao gồm string, tuple, range, và byte.
Một sequence có thể là đồng nhất (homogeneous) hoặc không đồng nhất (heterogeneous). Trong sequence đồng nhất, tất cả các phần tử đều có cùng một kiểu dữ liệu. Ví dụ, string là sequence đồng nhất vì mỗi phần tử đều là ký tự.
List, tuy nhiên, là sequence không đồng nhất, nơi bạn có thể lưu trữ các phần tử có kiểu dữ liệu khác nhau, bao gồm số nguyên, string, đối tượng, v.v.
Nhìn chung, các loại sequence đồng nhất hiệu quả hơn về mặt lưu trữ và thao tác so với sequence không đồng nhất.
Loại sequence và loại iterable
Một iterable là một tập hợp các đối tượng mà bạn có thể lấy từng phần tử một. Do đó, bất kỳ sequence nào cũng là iterable. Ví dụ, một list là iterable.
Tuy nhiên, một iterable không nhất thiết phải là sequence. Ví dụ, set là iterable nhưng không phải là sequence.
Nói chung, iterable là khái niệm rộng hơn so với sequence.
Các phương thức sequence chuẩn của Python
Dưới đây là một số phương thức sequence chuẩn:
Đếm số phần tử của một sequence
Để đếm số phần tử của một sequence, bạn sử dụng hàm tích hợp len
:
len(seq)
Ví dụ sau sử dụng hàm len
để đếm số phần tử trong list cities
:
cities = ['San Francisco', 'New York', 'Washington DC'] print(len(cities))
Kết quả:
3
Kiểm tra xem một phần tử có tồn tại trong sequence hay không
Để kiểm tra xem một phần tử có tồn tại trong sequence hay không, bạn sử dụng toán tử in
:
element in seq
Ví dụ sau sử dụng toán tử in
để kiểm tra xem 'New York' có trong list cities
hay không:
cities = ['San Francisco', 'New York', 'Washington DC'] print('New York' in cities)
Kết quả:
True
Để phủ định toán tử in
, bạn sử dụng toán tử not
. Ví dụ sau kiểm tra xem 'New York' không có trong list cities
:
cities = ['San Francisco', 'New York', 'Washington DC'] print('New York' not in cities)
Kết quả:
False
Tìm chỉ số của một phần tử trong sequence
Phương thức seq.index(e)
trả về chỉ số của lần xuất hiện đầu tiên của phần tử e
trong sequence seq
:
seq.index(e)
Ví dụ:
numbers = [1, 4, 5, 3, 5, 7, 8, 5] print(numbers.index(5))
Kết quả:
2
Nếu phần tử không có trong sequence, bạn sẽ gặp lỗi:
numbers = [1, 4, 5, 3, 5, 7, 8, 5] print(numbers.index(10))
Lỗi:
ValueError: 10 is not in list
Để tìm chỉ số của lần xuất hiện đầu tiên của một phần tử tại hoặc sau một chỉ số cụ thể, bạn sử dụng dạng sau của phương thức index
:
seq.index(e, i)
Ví dụ sau trả về chỉ số của lần xuất hiện đầu tiên của số 5 sau chỉ số thứ ba:
numbers = [1, 4, 5, 3, 5, 7, 8, 5] print(numbers.index(5, 3))
Kết quả:
4
Dạng sau của phương thức index
cho phép bạn tìm chỉ số của lần xuất hiện đầu tiên của một phần tử tại hoặc sau chỉ số i
và trước chỉ số j
:
seq.index(e, i, j)
Ví dụ:
numbers = [1, 4, 5, 3, 5, 7, 8, 5] print(numbers.index(5, 3, 5))
Kết quả:
4
Cắt một sequence
Để lấy một đoạn từ chỉ số i
đến (nhưng không bao gồm) j
, bạn sử dụng cú pháp sau:
seq[i:j]
Ví dụ:
numbers = [1, 4, 5, 3, 5, 7, 8, 5] print(numbers[2:6])
Kết quả:
[5, 3, 5, 7]
Khi bạn cắt một sequence, dễ tưởng tượng rằng các chỉ số của sequence nằm giữa hai phần tử như thế này:
+---+---+---+---+---+ | 1 | 4 | 5 | 3 | 5 | +---+---+---+---+---+ 0 1 2 3 4 5
Cắt mở rộng cho phép bạn lấy một đoạn từ i
đến (nhưng không bao gồm) j
theo bước nhảy k
:
seq[i:j:k]
Ví dụ:
numbers = [1, 4, 5, 3, 5, 7, 8, 5] print(numbers[2:6:2])
Kết quả:
[5, 5]
Lấy phần tử nhỏ nhất và lớn nhất từ một sequence
Nếu thứ tự giữa các phần tử trong sequence được xác định, bạn có thể sử dụng các hàm tích hợp min
và max
để tìm phần tử nhỏ nhất và lớn nhất:
numbers = [1, 4, 5, 3, 5, 7, 8, 5] print(min(numbers)) # 1 print(max(numbers)) # 8
Kết quả:
1 8
Nối hai sequence
Để nối hai sequence thành một sequence duy nhất, bạn sử dụng toán tử +
:
s3 = s1 + s2
Ví dụ sau nối hai sequence của các string:
east = ['New York', 'New Jersey'] west = ['San Diego', 'San Francisco'] cities = east + west print(cities)
Kết quả:
['New York', 'New Jersey', 'San Diego', 'San Francisco']
Nối các sequence không thể thay đổi là an toàn. Ví dụ sau thêm một phần tử vào list west
. Và nó không ảnh hưởng đến sequence cities
:
west.append('Sacramento') print(west) print(cities)
Kết quả:
['San Diego', 'San Francisco', 'Sacramento'] ['New York', 'New Jersey', 'San Diego', 'San Francisco']
Tuy nhiên, bạn nên cẩn thận với việc nối các sequence có thể thay đổi. Ví dụ sau cho thấy cách nối một list với chính nó:
city = [['San Francisco', 900_000]] cities = city + city print(cities)
Kết quả:
[['San Francisco', 900000], ['San Francisco', 900000]]
Vì list là mutable, địa chỉ bộ nhớ của phần tử đầu tiên và thứ hai trong list cities
là giống nhau:
print(id(cities[0]) == id(cities[1])) # True
Ngoài ra, khi bạn thay đổi giá trị từ list gốc, list kết hợp cũng thay đổi:
city[0][1] = 1_000_000 print(cities)
Tổng hợp lại:
city = [['San Francisco', 900_000]] cities = city + city print(cities) print(id(cities[0]) == id(cities[1])) # True city[0][1] = 1_000_000 print(cities)
Kết quả:
[['San Francisco', 900000], ['San Francisco', 900000]] True [['San Francisco', 1000000], ['San Francisco', 1000000]]
Lặp lại một sequence
Để lặp lại một sequence một số lần, bạn sử dụng toán tử nhân *
. Ví dụ sau lặp lại string Python
ba lần:
s = 'ha' print(s * 3)
Kết quả:
hahaha
Kết bài
Các sequence trong Python là tập hợp các phần tử được sắp xếp theo thứ tự vị trí. Sequence có thể đồng nhất hoặc không đồng nhất, mutable hoặc immutable. Các thao tác cơ bản trên sequence bao gồm đếm phần tử, kiểm tra sự tồn tại của phần tử, tìm chỉ số, cắt đoạn, lấy phần tử nhỏ nhất và lớn nhất, nối và lặp lại sequence. Hiểu rõ và sử dụng các thao tác này sẽ giúp bạn làm việc hiệu quả với các sequence trong Python.