Nếu bạn chỉ có thể thêm một kỹ năng – và không thể phủ nhận rằng đó là kỹ năng quan trọng nhất – vào hộp công cụ khoa học dữ liệu (data science toolbox) của bạn, đó chính là SQL. Mặc khác, trong hệ sinh thái phân tích dữ liệu Python, thư viện pandas cũng là một công cụ mạnh mẽ và phổ biến.
Tuy nhiên, nếu bạn mới bắt đầu với pandas, việc học cách sử dụng các chức năng của pandas – như nhóm (grouping), tổng hợp (aggregation), kết nối (joins) và nhiều chức năng khác – có thể làm bạn cảm thấy quá tải. Thay vì vậy, sẽ dễ dàng hơn nếu bạn truy vấn dữ liệu của mình bằng SQL. Thư viện pandasql cho phép bạn làm điều đó!
Học cách sử dụng thư viện pandasql để chạy các truy vấn SQL trên một dataframe pandas trên một bộ dữ liệu mẫu: