Lookaround là nhóm không chiếm giữ (non capturing group) dùng để so khớp dựa vào những gì nó tìm thấy trước (look ahead) và sau (look behind) một mẫu. Lookaround bao gồm: Positive lookahead: cú pháp (?=ABC) Negative lookahead: cú... Continue Reading →
Đặc điểm của lượng từ Tham lam (greedy): quantifier cố gắng so khớp với toàn bộ chuỗi (hay nhiều nhất có thể). Lười biếng (lazy): so khớp một kí tự một lần bắt đầu từ kí tự đầu tiên của... Continue Reading →
So khớp kí tự Unicode Mã kí tự phổ biến trước đây là mã ASCII, tuy nhiên, để đáp ứng với sự đa dạng về ngôn ngữ trên thế giới, mã Unicode ra đời đáp ứng hơn 100000 kí tự... Continue Reading →
Chúng ta đã làm quen với lớp kí tự từ các phần trước, trong phần này chúng ta sẽ ôn lại một số nội dung: Lớp kí tự (character classes) Phủ định lớp kí tự (negated character classes) Tổng và hiệu... Continue Reading →
Trong phần này chúng ta sẽ tìm hiểu cách gộp (group) các thành phần (kí tự, chuỗi, v.v.) để thực hiện các thao tác như: Thực hiện thay đổi luân phiên (alternation) giữa hai hay nhiều mẫu tuỳ chọn (optional... Continue Reading →
Trong phần này chúng ta sẽ tìm hiểu về các cách thức (gọi là các assertions hay anchors) dùng để đánh dấu phạm vi hay giới hạn (boundaries). Trong phần trước có ví dụ dùng kí hiệu \b để đánh... Continue Reading →
Trong phần này chúng ta sẽ tìm hiểu các cách đơn giản để so khớp với các mẫu dùng: Các chuỗi tầm thường (string literals) Các kí số (digits) Các kí tự (letters) Các kí tự đại diện (characters of... Continue Reading →
Giới thiệu Regular expression (tạm dịch: biểu thức thường quy) là một chuỗi kí tự đặc biệt được dùng như mẫu (pattern) để so khớp (matching) với các chuỗi. Xuất hiện vào những năm 1940 như là một cách để... Continue Reading →