Lọc dữ liệu trùng lặp trong Google Sheets

Đối với Tuyển dụng cũng như các lĩnh vực khác, chúng ta thường dùng Google Biểu mẫu để lấy data ứng viên hay khách hàng. Kết quả sẽ lưu vào Google Sheets giống như Excel chắc chắn việc trùng lặp dữ liệu là không thể nào tránh khỏi. Vậy làm sao để lọc dữ liệu trùng lặp trong Google Sheets (Trang tính)? Excel thì bạn dễ tìm trên mạng nhưng Google Sheets thì cách lọc có khác. Hiếu sẽ chia sẻ đến các bạn trong bài viết đầu tiên của trang Minh Hiếu HR và của chuyên mục Chia sẻ trong ngành.

Lọc dữ liệu trùng lặp trong Google Sheets
Lọc dữ liệu trùng lặp trong Google Sheets

Trong danh sách trên có nhiều tên bị trùng nhau. Chúng ta có thể tìm giữ liệu trùng nhau và lọc chúng theo nhiều cách, tùy nhu cầu của bạn.

Highlight (tìm) các dữ liệu trùng nhau

Để tìm dữ liệu trùng nhau trong Google Sheets, chúng ta chọn cột chứa dãy dữ liệu. Nhấp vào Định dạng chọn Định dạng theo điều kiện.

Highlight (tìm) các dữ liệu trùng nhau
Highlight (tìm) các dữ liệu trùng nhau

Trong bảng Quy tắc định dạng có điều kiện, chúng ta điền công thức như hình bên dưới.

Điền công thức
Điền công thức

=Countif(A:A;A1)>1

Chú ý: nếu dấu ” ; ” không đúng với máy của bạn thì hãy sửa thành dấu ” , ” nhé. Sửa chữ A thành chữ của cột bạn đang định dạng trong file của bạn.

Như vậy bạn đã thấy dễ dàng thấy được các dữ liệu trùng nhau, tiếp theo chúng ta sẽ lọc chúng. Có 2 cách lọc dữ liệu trùng nhau trong Google trang tính.

Lọc ra dữ liệu trùng hoặc không trùng

Hiếu chèn phía trên một hàng để đặt tên nhé. Tại ô kế bên đầu tiên, bạn nhập công thức như hình dưới, sau đó kéo công thức xuống hết nguyên cột.

Lọc ra dữ liệu trùng hoặc không trùng
Lọc ra dữ liệu trùng hoặc không trùng

=countif(A:A;A2)=1

Lúc này TRUE là các dữ liệu không bị trùng, còn FALSE là các dữ liệu bị trùng nhau. Chúng ta nhấp vào dãy số 1 để chọn dãy tên, nhấp Dữ liệu và chọn Bộ lọc.

Nhấp vào dãy số 1 để chọn dãy tên, nhấp Dữ liệu và chọn Bộ lọc
Nhấp vào dãy số 1 để chọn dãy tên, nhấp Dữ liệu và chọn Bộ lọc

Tiếp theo nhấp vào nút lọc. Bây giờ chúng ta muốn xem dữ liệu không trùng nhau thì giữ lại TRUE, còn muốn xem dữ liệu bị trùng nhau thì giữ lại FALSE.

Không trùng nhau thì giữ lại TRUE, trùng nhau thì giữ lại FALSE
Không trùng nhau thì giữ lại TRUE, trùng nhau thì giữ lại FALSE

Và kết quả thu được khi chúng ta giữ lại TRUE – dữ liệu không trùng.

Kết quả thu được khi chúng ta giữ lại TRUE
Kết quả thu được khi chúng ta giữ lại TRUE

Nhưng cách này chưa phải là tối ưu. Chúng ta chỉ xem được trùng hoặc không trùng. Điều mà chúng ta mơ ước chính là một danh sách đầy đủ dữ liệu, chỉ lọc bỏ đi những dữ liệu bị lặp 2 lần trở lên. Hiếu cam đoan đây là bài viết đầu tiên xuất hiện trên Google giúp bạn làm điều này. haha

Lọc bỏ dữ liệu xuất hiện lần 2 trở đi

Chọn ô đầu tiên kế bên cột chứa dữ liệu, Hiếu chọn cột B thì tương ứng với A2 sẽ là B2. Ở ô này bạn điền công thức như ảnh dưới.

Lọc bỏ dữ liệu xuất hiện lần 2 trở đi
Lọc bỏ dữ liệu xuất hiện lần 2 trở đi

Như vậy là những ô lặp lại lần thứ 2 trở đi sẽ đổi thành Tranngocminhhieu.com

=if(countif($A$2:A2;A2)=1;A2;”Tranngocminhhieu.com”)

Giải thích:

$A$2: là để cố định không thay đổi

A2: sẽ thay đổi khi kéo xuống

“Tranngocminhhieu.com”: Tùy bạn muốn ghi gì cũng được

Bây giờ để lọc lấy dữ liệu xuất hiện lần đầu tiên thì tích vào nút lọc > bỏ chọn Tranngocminhhieu.com > OK

Bỏ chọn Tranngocminhhieu.com là bỏ dữ liệu lặp
Bỏ chọn Tranngocminhhieu.com là bỏ dữ liệu lặp

Tuyệt vời chưa, hehe

Kết quả lọc được dữ liệu không bị trùng
Kết quả lọc được dữ liệu không bị trùng

Kết quả bạn đã có môt danh sách đầy đủ dữ liệu, không bị mất bất dữ liệu nào mà cũng không trùng dữ liệu nào. Bạn cũng có thể thấy được dữ liều nào có trùng ở ô có highlight.

Xóa dữ liệu trùng lặp trên Google Sheets

Google Sheets hiện đã có tính năng xóa dữ liệu trùng lặp. Bạn chỉ cần chọn cột muốn xóa dữ liệu trùng lặp > Data > Data cleanup > Remove duplicates.

Cách xóa dữ liệu trùng lặp Google Sheets
Cách xóa dữ liệu trùng lặp Google Sheets

Lời kết

Quá tuyệt vời phải không nào. Với cách lọc cuối cùng sẽ giúp bạn thực hiện được nhiều công việc đấy, chẳng hạn gửi email hoặc nhắn tin hàng loạt thì quá đã luôn. Mình gợi ý thêm một bài khá liên quan chủ đề này đó là cách gộp nhiều file Excel và CSV thành 1 Sheet. Bạn cảm thấy các cách làm trên thế nào và có khó khăn thế gì hãy để lại bình luận bên dưới bài viết nhé.

Bài viết liên quan

Trần Ngọc Minh Hiếu

Trần Ngọc Minh Hiếu

Mình hiện đang làm Data Analyst, trước đó từng làm Digital Marketing. Viết blog là một niềm vui của mình, giúp mình chia sẻ lại những kiến thức và trải nghiệm từ cuộc sống và công việc. Bạn có thể donate cho mình tại đây.

29 bình luận về “Lọc dữ liệu trùng lặp trong Google Sheets”

  1. Ad cho hỏi, ở cột B của nhiều sheet đều có nhiều mã khách hàng, mình muốn cảnh báo khi có mã khách hàng trùng (các mã trùng nằm ở các sheet khác nhau) thì phải làm thế nào. Xin chân thành cảm ơn

    Bình luận
  2. em chào anh, anh cho e hỏi 1 chút. Em tải file đơn hàng trên shopee về và xử lý trên google sheet. Cùng 1 đơn hàng nhưng có 3 sp khác nhau thì khi tải file sẽ chia thành 3 hàng với 3 sản phẩm. Làm thế nào để em có thể kết hợp 3 hàng đó thành 1 hàng ạ

    Bình luận
    • Chào Thị Bình, ý tưởng sẽ là gộp tên 3 sản phẩm vào chung 1 ô. Nhưng mà để làm được tự động thì không dễ. Với kiến thức của Lucid Gen đang có thì phải dùng Python để xử lý.

  3. anh ơi , muốn hỏi em có nhiều mã đơn trùng nhau em muốn tạo 1 cột để phân tích tổng số lần mà mã đó bị trùng thì em làm như thế nào ạ .

    Bình luận
  4. E chào ad, cảm ơn bài viết hữu ích của ad. Nhưng trong quá trình thực hiện lọc dữ liệu của e thì có 1 số dữ liệu chỉ xuất hiện 1 lần khi lọc thì lại hiện false. Ad giải đáp giúp e với ạ. E cảm ơn

    Bình luận

Viết một bình luận

Hãy thoải mái để lại bình luận của bạn, chúng tôi sẽ kiểm duyệt và phản hồi trong thời gian sớm nhất. Vui lòng sử dụng email thật để đảm bảo bình luận được duyệt và nhận thông báo khi chúng tôi trả lời. Bạn cũng có thể thêm ảnh đại diện cho email của mình.