Hàm MATCH và AGAINST trong MySQL
Trong bài học này mình sẽ giới thiệu thuật ngữ Natural Language Full-Text Searches, bằng cách sử dụng hai hàm MATCH() and AGAINST() trong MySQL.
Trong kỹ thuật tìm kiếm Full Text Search, MySQL tìm kiếm các hàng hoặc tài liệu có liên quan đến truy vấn ngôn ngữ tự nhiên của văn bản một cách tự do. MySQL tính toán mức độ liên quan dựa trên các yếu tố khác nhau bao gồm số lượng từ trong tài liệu, số lượng từ duy nhất trong tài liệu, tổng số từ trong collection và số lượng tài liệu (hàng) có chứa một từ cụ thể.
Để thực hiện tìm kiếm toàn văn bản bằng tìm kiếm tự nhiên ta sử dụng các hàm MATCH()
và AGAINST()
. Hàm MATCH ()
chỉ định cột nơi bạn muốn tìm kiếm và hàm AGAINST()
xác định biểu thức tìm kiếm sẽ được sử dụng.
1. Cách sử dụng hàm MATCH () và AGAINST ()
Trước khi bắt đầu thì ta hãy tạo một table có cấu trúc như sau:
Bài viết này được đăng tại [free tuts .net]
Sau đó mình tạo Index Full Text Search cho cột productLine
.
ALTER TABLE products ADD FULLTEXT(productline);
Tiếp theo, để truy vấn tìm kiếm cho cột này bằng kỹ thuật Full Text Search thì ta sử dụng hai hàm trên như sau:
SELECT productName, productLine FROM products WHERE MATCH(productLine) AGAINST('Classic');
Kết quả trả về là những record mà cột productLine
có xuất hiện từ Classic.
Để tìm theo hai từ Classic hoặc Vintage thì ta sẽ ngăn cách nó bằng dấu phẩy.
SELECT productName, productLine FROM products WHERE MATCH(productline) AGAINST('Classic,Vintage') ORDER BY productName;
Kết quả:
Hàm AGAINST()
theo mặc định sẽ nằm ở chế độ IN NATURAL LANGUAGE MODE
, đầy là các chế độ mà ta sẽ được học ở bài tiếp theo.
Bạn có thể xác định chế độ này một cách tường minh bằng cách thêm từ khóa IN NATURAL LANGUAGE MODE
vào tham số thứ hai của hàm.
SELECT productName, productLine FROM products WHERE MATCH(productline) AGAINST('Classic,Vintage' IN NATURAL LANGUAGE MODE)
Theo mặc định, MySQL thực hiện tìm kiếm theo kiểu không phân biệt chữ hoa chữ thường. Tuy nhiên bạn có thể sử dụng tìm kiếm kiểu binary collation cho cột index thì sẽ phân biệt được.
2. Sắp xếp kết quả trả về dựa vào mức độ liên quan
Một tính năng rất quan trọng trong việc xử lý tìm kiếm đó là sắp xếp kết quả trả về theo thứ tự: tài liệu nào giống nhiều nhất thì nằm trên cùng, giống ít nhất thì nằm dưới cùng.
Khi bạn sử dụng hàm MATCH()
ở lệnh WHERE thì MySQL sẽ trả về giá trị có mức độ liên quan lên đầu tiên.
Hãy xem ví dụ dưới đây để hiểu rõ hơn. Mình đã tạo một Index Full Text Search cho field productName.
ALTER TABLE products ADD FULLTEXT(productName);
Tiếp theo mình muốn truy vấn tìm kiếm trên field này, bằng hai từ khóa Ford hoặc 1932 hoặc có cả hai.
SELECT productName, productLine FROM products WHERE MATCH(productName) AGAINST('1932,Ford');
Kết quả xuât hiện như sau:
Những kết quả xuất hiện cả hai từ cùng lúc sẽ được ưu tiên đặt trên cùng, tiếp theo là những record chỉ xuất hiện 1 từ.
Tóm lai, bạn cần lưu ý những vấn đề sau khi làm việc với full text search trong MySQL:
- Độ dài tối thiểu cho từ cần tìm là 4. Ví dụ bạn tìm từ "và" hoặc "tôi" thì mặc định MySQL sẽ xác định đó là những từ vô nghĩa. Vì trong tiếng Anh những từ có 3 chữ cái đều là vô nghĩa. Tuy nhiên bạn có thể mở
file /etc/mysql/my.cnf
và tìm đến dòngft_min_word_len = 3
chỉnh lại số mong muốn. - Có một số từ Stop Words sẽ bị bỏ qua nằm trong file
storage/myisam/ft_static.c
. Bạn muốn thay đổi thì hãy vào file đó nhé.
Như vậy là mình đã hướng dẫn xong cách sử dụng hai hàm MATCH và AGAINST để truy vấn Full Text Search trong MySQL. Chúc các bạn thực hiện thành công, hẹn gặp lại ở bài tiếp theo.