Cấu trúc cây nhị phân là gì? Hoạt động ra sao?
Trong bài này mình sẽ giới thiệu các bạn một trong các cấu trúc dữ liệu tiếp theo đó chính là cấu trúc dữ liệu dạng cây. Đây là một dạng cấu trúc được sử dụng rất nhiều trong tìm kiếm, nó được tối ưu nhất trong các cấu trúc dữ liệu mà mình đã giới thiệu.
Chúng ta sẽ cùng nhau tìm hiểu về cấu trúc dữ liệu cây là gì? Có các loại cấu trúc dữ liệu cây nào và cách thức hoạt động của nó.
1. Cấu trúc dữ liệu cây là gì?
Cấu trúc dữ liệu cây là một cấu trúc biểu diễn các Node dưới dạng cây. Như các bạn đã học ở môn lập trình C/C++ thì khi chúng ta muốn lưu các phần tử, ta có thể lưu chúng dưới dạng mảng một chiều. Hoặc có thể lưu dưới dạng một danh sách liên kết. Tương tự như vậy các bạn cũng có thể lưu dưới dạng cây nhị phân.
Ưu điểm của cấy trúc dữ liệu cây so với các cấu trúc khác là:
Bài viết này được đăng tại [free tuts .net]
- Phân cấp dữ liệu.
- Tìm kiếm dễ dàng hơn.
- Thao tác trên các danh sách dữ liệu đã sắp xếp.
Trong cấu trúc dữ liệu cây, có hai cấu trúc chính đó là cấu trúc cây nhị phân và cấu trúc cây nhị phân tìm kiếm. Sau đây chúng ta sẽ tìm hiểu qua về hai cấu trúc dữ liệu này nhé.
2. Cây nhị phân (Binary tree)
Cây nhị phân là một cấu trúc dữ liệu được sử dụng cho mục đích lưu trữ dữ liệu. Một cây nhị phân bao gồm các Node và mỗi Node bao gồm 3 thành phần:
- Data: Giá trị của một phần tử
- Left pointer: Con trỏ trỏ đến cây nhị phân bên trái Node.
- Right pointer: Con trỏ trỏ đến cây nhị phân bên phải Node.
Các thành phần cơ bản của cây nhị phân bao gồm:
- Root: Được gọi là Node gốc của cây (là một Node cha), một cây chỉ có một Node gốc duy nhất và nó không có Node cha nào.
- Parent Node: Là Node cha của một Node cụ thể nào đó.
- Child Node: Là Node con của một Node cụ thể nào đó.
- Sub-tree: Là cây con biểu diển các con của một Node.
- LeafNode: Là Node không có Node con.
- Siblings: Các Node có cùng một cha.
- Internal Node: Node có ít nhất một Node con.
- External Node: Node không có Node con nào.
3. Cây nhị phân tìm kiếm (Binary search tree)
Cây nhị phân tìm kiếm là một dạng đặc biệt của cây nhị phân. Về cơ bản nó có đủ tất cả các thành phần của cây nhị phân. Nhưng tất cả các Node của nó đều có chung một đặc điểm sau:
- Cây con bên trái của một Node luôn luôn có giá trị nhỏ hơn hoặc bằng giá trị của Node cha phía trên nó.
- Cây con bên phải của một Node luôn luôn có giá trị lớn hơn hoặc bằng giá trị của Node cha phía trên nó.
Biểu diễn cây nhị phân tìm kiếm
Cây nhị phân tìm kiếm là một tập hợp các Node được sắp xếp và lưu trữ theo một quy tắc nhất định. Dựa vào quy tắc đó chúng ta có thể duy trì và thực hiện các thao tác trên cây nhị phân tìm kiếm. Các bạn hãy xem hình dưới đây để hiểu rõ hơn về quy tắc của nó:
Giả sử ta có các phần tử số nguyên như sau: 27, 14, 35, 10, 19, 31, 32. Quá trình lưu trữ các phần tử này theo cấu trúc cây nhị phân tìm kiếm được thực hiện như sau:
- Số 27 sẽ được lưu trữ vào cây đầu tiên và nó được lấy làm key để so sánh.
- Số 14 được so sánh với số 27 (key), vì 14 < 27 nên sẽ được lưu trữ vào bên trái số 27 (key).
- Số 35 > 27 vì vậy sẽ được lưu trữ vào bên phải số 27.
- Tiếp tục số 10 < 27 và 10 < 14 vì vậy nó sẽ nằm bên trái số 14.
- Số 19 < 27 và 19 > 14 vì vậy nó sẽ nằm bên phải số 14.
- Số 31 > 27 và 31 < 35 vì vậy nó sẽ nằm bên trái số 35.
- Cuối cùng số 42 > 27 và 42 > 35 vị vậy nó sẽ nằm bên phải số 35.
Sau khi thực hiện lưu trữ các phần tử số nguyên trên vào cây ta được một cây như trong hình.
Các thao tác trên cây nhị phân tìm kiếm
Trong cây nhị phân tìm kiếm ta có thể thực hiện các thao tác sau:
- Chèn một phần tử vào trong một cây.
- Tìm kiếm phần tử trong cây.
- Duyệt cây.
- Đo chiều cao của cây.
Trên đây là các thao tác thường được sử dụng nhiều trong cây. Đặc biệt là tìm kiếm phần tử trong cây, như cái tên của nó là cây nhị phân tìm kiếm. Đây là một cấu trúc dữ liệu được sử dụng trong các bài toán tìm kiếm rất nhiều, bởi tính chính xác và tốc độ của nó.
4. Kết luận
Như vậy là chúng ta đã tìm hiểu xong về cấu trúc dữ liệu cây là gì. Và các hai cấu trúc dữ liệu cây nhị phân và nhị phân tìm kiếm. Các bạn hãy sử dụng các cấu trúc dữ liệu thật linh hoạt nhé, bởi mỗi cấu trúc dữ liệu đều có các ưu điểm nhất định. Ở bài tiếp theo mình sẽ hướng dẫn các cấu trúc dữ liệu của cây và cách thêm Node vào cây, hãy chú ý theo dõi nhé !!!