INNER JOIN trong MySQL
Trong bài này chúng ta tìm hiểu cách sử dụng INNER JOIN
để kết hai bảng với nhau.
Ở bài tích đề cát chúng ta đã tìm hiểu cách truy vấn dữ liệu nhiều hơn một bảng, kết hợp mối quan hệ khóa ngoại để truy vấn thông tin. Và trường hợp này để xác định khóa ngoại chính xác thì ở WHERE
ta thêm điều kiện để lọc.
Trong bài này chúng ta sử dụng ví dụ dưới đây để demo nhé. Có hai bảng sinhvien
và lop
, bảng sinhvien
sẽ có một khóa ngoại là LopID
và tham chiếu đến bảng lop
có khóa chính là LopID
:
Bài viết này được đăng tại [free tuts .net]
Trong đó dữ liệu của bảng sinhvien
như sau:
Và đây là dữ liệu của bảng lop
:
1. Tìm hiểu INEER JOIN trong MySQL
Giả sử chúng ta cần viết một câu truy vấn xem danh sách sinh viên và lớp mà sinh viên đó đang học thì chúng ta dựa vào khóa ngoại (foreign key) của bảng sinhvien
và khóa chính của bảng lop
để truy vấn. Chúng ta có hai cách giải.
Sử dụng phép tích đề cát
SELECT * FROM sinhvien, lop WHERE sinhvien.LopID = lop.LopID
Sử dụng INNER JOIN
SELECT * FROM sinhvien INNER JOIN lop ON sinhvien.LopID = lop.LopID
Cả hai câu truy vấn đề có kết quả giống nhau như hình dưới đây.
Vậy sự khác nhau giữa hai câu truy vấn trên là gì?
- Với phép tích thì sau khi tích hai bảng lại với nhau nó sẽ có tổng cộng là 10 x 3 = 30 records, sau đó ở mỗi record nó sẽ kiểm tra điều kiện nếu sinhvien.LopID = lop.LopID đúng thì record đó sẽ được chọn, ngược lại thì không được chọn.
- Với INNER JOIN thì khác một xíu, trong quá trình thực hiện tích hai bảng nó sẽ kiểm tra điều kiện ở ON (tức là sinhvien.LopID = lop.LopID), nếu đúng thì được chọn và sai thì bỏ qua
Như vậy xét về tốc độ truy vấn thì trường hợp sử dụng INNER JOIN sẽ nhanh hơn rất nhiều so với sử dụng phép tích.
Từ ví dụ trên ta rút ra được kết luận INNER JOIN sẽ được đặt ở FROM theo cú pháp sau:
SELECT column_list FROM t1 INNER JOIN t2 ON join_condition1 WHERE where_conditions;
Trong đó:
- t1, t2 là bảng cần
JOIN
- join_condition1: Nếu TRUE thì record đó sẽ được chọn
Ta có thể ví phép JOIN
giống như so sánh dữ liệu giữa hai bảng nếu có sự tương đồng thì được chọn và ngược lại thì không chọn như hình dưới đây.
Ảnh (Sưu tầm)
2. INNER JOIN nhiều table trong MySQL
Ở ví dụ phần 1 ta chỉ mới tìm hiểu cách JOIN
hai bảng, tuy nhiên bạn có thể JOIN
nhiều bảng lại với nhau và tuân theo quy luật chạy từ trái qua phải, nếu bảng nào khai báo trước thì chạy trước và ngược lại sẽ chạy sau. Nếu bạn sử dụng cặp dấu ngoặc thì sẽ thực hiện trong ngoặc trước.
Cú pháp:
SELECT column_list FROM t1 INNER JOIN t2 ON join_condition1 INNER JOIN t3 ON join_condition2
Làm vài ví dụ cho vui nhé .
Cho sơ đồ cơ sở dữ liệu sau:
SELECT * FROM sinhvien INNER JOIN lop ON sinhvien.LopID = lop.LopID INNER JOIN khoa ON sinhvien.KhoaID = khoa.KhoaId
SELECT * FROM sinhvien INNER JOIN lop ON sinhvien.LopID = lop.LopID INNER JOIN khoa ON sinhvien.KhoaID = khoa.KhoaId WHERE lop.TenLop = 'TOAN'
Trong ví dụ này ta thêm điều kiện lop.TenLop = 'TOAN'
ở WHERE
.
Các ví dụ này nếu ta sử dụng truy vấn lồng thì sẽ nhanh hơn nữa, tuy nhiên vấn đề này tôi sẽ trình bày sau nhé .
3. Tránh lỗi ambiguous khi thực hiện INNER JOIN
Ở các ví dụ trên các bạn thấy tên column ở các bảng trùng khá nhiều như LopID
trùng ở bảng sinhvien
và lop, KhoaID
trùng ở bảng sinhvien
và khoa
. Vậy làm sao để phân biệt giữa các field?
Ví dụ câu truy vấn này chạy sẽ bị lỗi vì lý do ở SELECT
nó không hiểu LopID
từ bảng nào.
SELECT TenSV, TenLop, LopID FROM sinhvien INNER JOIN lop ON sinhvien.LopID = lop.LopID
Nếu để ý kĩ thì bạn thấy ở ON
đã sử dụng một cú pháp giúp phân biệt đó là tenbang.field
. Sửa lại câu truy vấn như sau và mọi thứ OK.
SELECT TenSV, TenLop, lop.LopID FROM sinhvien INNER JOIN lop ON sinhvien.LopID = lop.LopID
Như vậy với cột nào bị trùng thì ta phải sử dụng cú pháp tenbang.tenfield
.
4. INNER JOIN với ALIAS
Chúng ta đã được học cú pháp ALIAS và tác dụng của nó rồi nên bây giờ ta áp dụng vào lệnh JOIN
luôn.
Các bạn xem câu truy vấn dưới đây:
SELECT TenSV, TenLop, l.LopID FROM sinhvien AS sv INNER JOIN lop AS l ON sv.LopID = l.LopID
Nhìn gọn hơn rất nhiều đúng không nào, cách này rất hữu ích khi tên bảng quá dài và join nhiều table.
5. Lời kết
JOIN khá quan trọng trong các hệ quản trị CSDL
như MySQL
, SQL SERVER
, ORACLE
. Riêng với NO-SQL
thì JOIN
không tồn tại nhé các bạn. Còn NO-SQL
là gì thì bạn có thể xem qua bài MongoDB là gì?.