Lọc dữ liệu trùng lặp trong Google Sheets

Đối với Tuyển dụng cũng như các lĩnh vực khác, chúng ta thường dùng Google Biểu mẫu để lấy data ứng viên hay khách hàng. Kết quả sẽ lưu vào Google Sheets giống như Excel chắc chắn việc trùng lặp dữ liệu là không thể nào tránh khỏi. Vậy làm sao để lọc dữ liệu trùng lặp trong Google Sheets (Trang tính)? Excel thì bạn dễ tìm trên mạng nhưng Google Sheets thì cách lọc có khác. Hiếu sẽ chia sẻ đến các bạn trong bài viết đầu tiên của trang Minh Hiếu HR và của chuyên mục Chia sẻ trong ngành.

Lọc dữ liệu trùng lặp trong Google Sheets
Lọc dữ liệu trùng lặp trong Google Sheets

Trong danh sách trên có nhiều tên bị trùng nhau. Chúng ta có thể tìm giữ liệu trùng nhau và lọc chúng theo nhiều cách, tùy nhu cầu của bạn.

Highlight (tìm) các dữ liệu trùng nhau

Để tìm dữ liệu trùng nhau trong Google Sheets, chúng ta chọn cột chứa dãy dữ liệu. Nhấp vào Định dạng chọn Định dạng theo điều kiện.

Highlight (tìm) các dữ liệu trùng nhau
Highlight (tìm) các dữ liệu trùng nhau

Trong bảng Quy tắc định dạng có điều kiện, chúng ta điền công thức như hình bên dưới.

Điền công thức
Điền công thức

=Countif(A:A;A1)>1

Chú ý: nếu dấu ” ; ” không đúng với máy của bạn thì hãy sửa thành dấu ” , ” nhé. Sửa chữ A thành chữ của cột bạn đang định dạng trong file của bạn.

Như vậy bạn đã thấy dễ dàng thấy được các dữ liệu trùng nhau, tiếp theo chúng ta sẽ lọc chúng. Có 2 cách lọc dữ liệu trùng nhau trong Google trang tính.

Lọc ra dữ liệu trùng hoặc không trùng

Hiếu chèn phía trên một hàng để đặt tên nhé. Tại ô kế bên đầu tiên, bạn nhập công thức như hình dưới, sau đó kéo công thức xuống hết nguyên cột.

Lọc ra dữ liệu trùng hoặc không trùng
Lọc ra dữ liệu trùng hoặc không trùng

=countif(A:A;A2)=1

Lúc này TRUE là các dữ liệu không bị trùng, còn FALSE là các dữ liệu bị trùng nhau. Chúng ta nhấp vào dãy số 1 để chọn dãy tên, nhấp Dữ liệu và chọn Bộ lọc.

Nhấp vào dãy số 1 để chọn dãy tên, nhấp Dữ liệu và chọn Bộ lọc
Nhấp vào dãy số 1 để chọn dãy tên, nhấp Dữ liệu và chọn Bộ lọc

Tiếp theo nhấp vào nút lọc. Bây giờ chúng ta muốn xem dữ liệu không trùng nhau thì giữ lại TRUE, còn muốn xem dữ liệu bị trùng nhau thì giữ lại FALSE.

Không trùng nhau thì giữ lại TRUE, trùng nhau thì giữ lại FALSE
Không trùng nhau thì giữ lại TRUE, trùng nhau thì giữ lại FALSE

Và kết quả thu được khi chúng ta giữ lại TRUE – dữ liệu không trùng.

Kết quả thu được khi chúng ta giữ lại TRUE
Kết quả thu được khi chúng ta giữ lại TRUE

Nhưng cách này chưa phải là tối ưu. Chúng ta chỉ xem được trùng hoặc không trùng. Điều mà chúng ta mơ ước chính là một danh sách đầy đủ dữ liệu, chỉ lọc bỏ đi những dữ liệu bị lặp 2 lần trở lên. Hiếu cam đoan đây là bài viết đầu tiên xuất hiện trên Google giúp bạn làm điều này. haha

Lọc bỏ dữ liệu xuất hiện lần 2 trở đi

Chọn ô đầu tiên kế bên cột chứa dữ liệu, Hiếu chọn cột B thì tương ứng với A2 sẽ là B2. Ở ô này bạn điền công thức như ảnh dưới.

Lọc bỏ dữ liệu xuất hiện lần 2 trở đi
Lọc bỏ dữ liệu xuất hiện lần 2 trở đi

Như vậy là những ô lặp lại lần thứ 2 trở đi sẽ đổi thành Tranngocminhhieu.com

=if(countif($A$2:A2;A2)=1;A2;”Tranngocminhhieu.com”)

Giải thích:

$A$2: là để cố định không thay đổi

A2: sẽ thay đổi khi kéo xuống

“Tranngocminhhieu.com”: Tùy bạn muốn ghi gì cũng được

Bây giờ để lọc lấy dữ liệu xuất hiện lần đầu tiên thì tích vào nút lọc > bỏ chọn Tranngocminhhieu.com > OK

Bỏ chọn Tranngocminhhieu.com là bỏ dữ liệu lặp
Bỏ chọn Tranngocminhhieu.com là bỏ dữ liệu lặp

Tuyệt vời chưa, hehe

Kết quả lọc được dữ liệu không bị trùng
Kết quả lọc được dữ liệu không bị trùng

Kết quả bạn đã có môt danh sách đầy đủ dữ liệu, không bị mất bất dữ liệu nào mà cũng không trùng dữ liệu nào. Bạn cũng có thể thấy được dữ liều nào có trùng ở ô có highlight.

Xóa dữ liệu trùng lặp trên Google Sheets

Google Sheets hiện đã có tính năng xóa dữ liệu trùng lặp. Bạn chỉ cần chọn cột muốn xóa dữ liệu trùng lặp > Data > Data cleanup > Remove duplicates.

Cách xóa dữ liệu trùng lặp Google Sheets
Cách xóa dữ liệu trùng lặp Google Sheets

Lời kết

Quá tuyệt vời phải không nào. Với cách lọc cuối cùng sẽ giúp bạn thực hiện được nhiều công việc đấy, chẳng hạn gửi email hoặc nhắn tin hàng loạt thì quá đã luôn. Mình gợi ý thêm một bài khá liên quan chủ đề này đó là cách gộp nhiều file Excel và CSV thành 1 Sheet. Bạn cảm thấy các cách làm trên thế nào và có khó khăn thế gì hãy để lại bình luận bên dưới bài viết nhé.

Trần Ngọc Minh Hiếu

Hiếu (sinh năm 1996) là Cử nhân Quản trị Kinh doanh (ĐH Công nghệ Sài Gòn), hiện là chuyên viên Phân tích Dữ liệu tại Ninja Van, với với kinh nghiệm dày dặn trong lĩnh vực Phân tích Dữ liệu và Digital Marketing. Blog này là nơi Hiếu chia sẻ những trải nghiệm thực tế từ công việc và cuộc sống.

29 bình luận

  1. Chào các bạn. Mình đang cần lọc số điện thoại trùng nhau giữa các sheet trên google sheet nhưng chưa biết cách phải làm thế nào. Mong các bạn hỗ trợ. Mình xin cảm ơn

    Reply
    • Giữa các sheet thì khó đấy, mình thấy khả năng chỉ làm trong 1 sheet được thôi. Mình sẽ nghiên cứu thêm có cách nào không, nhưng khả năng là phải dùng tiện ích của một bên thứ 3

    • hi anh, anh đã nghiên cứu được cách nào để lọc trùng dữ liệu giữa 2 sheet chưa ạ?

  2. Siêu tuyệt vời luôn. Lần đầu thấy ai dạy mà dễ hiểu, ví dụ gần gũi thực tế vậy luôn. Mong bạn sẽ ra nhiều bài hơn nữa

    Reply
    • Cảm ơn Thanh Tâm nhé. Bài biết này mình cũng đang muốn chỉnh sửa để bổ sung thêm một vài kiến thức mới. Bạn có thể theo dõi blog của mình qua Facebook hoặc đăng ký nhận thông báo khi mình đăng bài mới qua email nha.

  3. Dạ em cảm ơn, hiện em có dữ liệu thô anh có thể truy cập vào Drive online của em và làm hàm giúp em với được không ạ 🙂 vì không phải dân chuyên gia nên rất bí phần này ạ

    Reply
  4. Em cảm ơn anh phản hồi, tuy nhiên dữ liệu mà em đang sử lý là dữ liệu luôn luôn thay đổi vì sẽ có thêm những học sinh mới đăng kí và những học sinh nghỉ, đi kèm là những dữ liệu trong các cột khác cũng sẽ thay đổi thì em muốn tạo một sheet khác có thể giúp mình theo dõi dữ liệu hàng ngày, hàng tuần, hàng tháng khi cần ấy ạ

    Reply
    • Chào Ami
      Vậy em dùng cách 2 mà anh nói đi, dùng hàm IF kết hợp AND. Sau đó theo dõi Filter dựa theo cột đó. Công thức thì em cứ kéo thẳng xuống dư ra vài chục hàng. Dù dữ liệu của em có thay đổi thì cột đó cũng sẽ thay đổi theo

      Còn một cách khác nữa là em dùng định dạng có điều kiện để biến đổi màu sắc nhưng cách này hơi khó, nếu em tìm ra được thì tốt.

  5. Chào anh nhé, em là Ami, em đang gặp chút rắc rối khi sử lý một bảng danh sách học sinh của trung tâm bao gồm học sinh đang học và học sinh đã nghỉ, trong đó có các trường (cột) thông tin như lớp, số buổi học còn lại vân vân, vậy làm sao để em lọc được ra danh sách học sinh đang học và ở trong lớp mà em mong muốn (xuất và sheet khách trong cùng 1 file)
    Rất mong anh phản hồi giúp đỡ. em cảm ơn anh

    Reply
    • Chào Ami, trường hợp của em anh thấy có 2 cách làm như sau:

      Cách 1: Em dùng chức năng Filter (lọc) để lọc theo giá trị 2 cột mà em muốn.
      Cách 2: Em tạo thêm một cột ở ngoài cùng bên phải đặt tên ví dụ như “Học sinh đang học và ở trong lớp” rồi em dùng hàm if(and(điều kiện 1, điều kiện 2),”Chọn”,”Không chọn”). Sau đó em sắp theo thứ tự A-Z của cột mới tạo hoặc dùng Filter (lọc) theo cột mới tạo. Rồi em copy list lọc được ra một sheet khác

      Em thử xem nhé

Viết một bình luận

Hãy thoải mái để lại bình luận của bạn, chúng tôi sẽ kiểm duyệt và phản hồi trong thời gian sớm nhất. Vui lòng sử dụng email thật để đảm bảo bình luận được duyệt và nhận thông báo khi chúng tôi trả lời. Bạn cũng có thể thêm ảnh đại diện cho email của mình.