Dữ liệu trùng lặp là cơn ác mộng quen thuộc với bất kỳ ai làm việc với bảng tính. Bạn đang quản lý danh sách khách hàng, theo dõi đơn hàng, hay gộp báo cáo từ nhiều nguồn – vấn đề duplicate data luôn rình rập. Để lâu không xử lý, dữ liệu trùng sẽ làm phình file, sai lệch thống kê và ảnh hưởng trực tiếp đến chất lượng báo cáo.
Nếu bạn chưa quen với công cụ này, hãy xem Google Sheets là gì và cách tạo Google Sheet trước khi thực hiện lọc dữ liệu. Bài viết này tổng hợp 3 cách lọc dữ liệu trùng trong Google Sheets – từ cơ bản đến nâng cao – giúp bạn xử lý sạch dữ liệu chỉ trong vài phút, dù bạn là người mới hay đã có kinh nghiệm. Ngoài Sheets, nếu bạn thường xuyên soạn thảo văn bản, hãy tham khảo thêm tổng hợp thủ thuật Google đầy đủ để tối ưu hiệu suất làm việc toàn diện.
Tại Sao Dữ Liệu Trùng Lặp Là Vấn Đề Nghiêm Trọng?
Từ kinh nghiệm xử lý hàng chục file dữ liệu khách hàng thực tế, tôi nhận thấy dữ liệu trùng thường xuất hiện do 4 nguyên nhân chính:

- Nhập liệu thủ công nhiều lần, đặc biệt khi nhiều người cùng chỉnh sửa một sheet
- Gộp file báo cáo từ nhiều phòng ban hoặc chi nhánh
- Đồng bộ dữ liệu từ CRM, Google Form hoặc các nguồn khác nhau
- Lỗi trong công thức tự động điền dữ liệu
Hậu quả trực tiếp khi để tồn tại dữ liệu trùng:
- Số liệu thống kê bị phóng đại (doanh số, số lượng khách hàng ảo)
- Báo cáo sai lệch dẫn đến quyết định kinh doanh thiếu chính xác
- Gửi email marketing trùng lặp, gây khó chịu và mất uy tín
- Tốn tài nguyên xử lý khi file phình to không cần thiết
Kinh nghiệm thực chiến: Trong một dự án gộp data khách hàng từ 5 chi nhánh với hơn 20.000 dòng, chúng tôi phát hiện gần 3.200 bản ghi trùng lặp – chiếm tới 16% tổng dữ liệu. Nếu không lọc trước khi phân tích, toàn bộ báo cáo doanh số quý sẽ sai lệch nghiêm trọng.
Cách 1: Lọc Dữ Liệu Trùng Bằng Hàm UNIQUE (Nhanh Nhất)
Hàm UNIQUE là lựa chọn nhanh nhất khi bạn cần trích xuất danh sách không trùng ra một vùng riêng. Hàm này hoạt động như bộ lọc tự động – dữ liệu gốc thay đổi, kết quả cập nhật ngay lập tức, không cần thao tác lại. Đây là một trong các hàm Google Sheets phổ biến mà bất kỳ ai làm việc với dữ liệu đều nên nắm vững; bạn có thể kết hợp với cách cố định cột trong Google Sheet để dễ quan sát kết quả hơn khi bảng dữ liệu có nhiều cột.
Cú pháp
=UNIQUE(phạm_vi)
Các bước thực hiện
Bước 1: Chọn một ô trống ngoài vùng dữ liệu gốc (ví dụ: ô D2), nơi sẽ hiển thị kết quả đã lọc.
Bước 2: Nhập công thức: =UNIQUE(A2:B7) – thay A2:B7 bằng phạm vi dữ liệu thực tế của bạn.

Bước 3: Nhấn Enter. Google Sheets sẽ tự động trả về danh sách các giá trị duy nhất, không trùng lặp.

Ví dụ: Nếu cột A chứa tên khách hàng và cột B chứa số điện thoại, =UNIQUE(A2:B7) sẽ trả về danh sách các cặp (tên + SĐT) không bị lặp lại.
Lưu ý quan trọng: Hàm UNIQUE chỉ lọc theo toàn bộ hàng. Nếu hai bản ghi có cùng email nhưng khác tên, hàm sẽ giữ cả hai. Xem phần COUNTIF bên dưới nếu bạn cần lọc theo một cột cụ thể.
Cách 2: Đánh Dấu Dữ Liệu Trùng Bằng Conditional Formatting
Khi bạn không muốn xóa dữ liệu ngay mà cần kiểm tra trước, Định dạng có điều kiện (Conditional Formatting) là công cụ lý tưởng. Các ô trùng sẽ được tô màu nổi bật để bạn dễ dàng rà soát.
Các bước thực hiện
Bước 1: Chọn vùng dữ liệu cần kiểm tra (ví dụ: A2:B7).
Bước 2: Vào menu: Định dạng > Định dạng có điều kiện.

Bước 3: Ở mục "Định dạng ô nếu", chọn Công thức tùy chỉnh là.
Bước 4: Nhập công thức: =COUNTIF(A:A,A2)>1
Bước 5: Chọn màu nền nổi bật (ví dụ: đỏ hoặc vàng) rồi nhấn Đã xong.

Giải thích công thức: COUNTIF(A:A,A2) đếm số lần giá trị ô A2 xuất hiện trong cột A. Nếu kết quả lớn hơn 1, nghĩa là giá trị đó bị trùng và sẽ được tô màu.
Mẹo thực chiến: Áp dụng Conditional Formatting trước khi xóa để chắc chắn bạn đang xóa đúng bản ghi. Đây là bước kiểm tra an toàn không thể bỏ qua khi làm việc với dữ liệu quan trọng.
Cách 3: Lọc Và Phân Loại Dữ Liệu Bằng Hàm COUNTIF + Bộ Lọc
Phương pháp này cho phép bạn tách riêng hai nhóm: dữ liệu trùng và không trùng, rất hữu ích khi cần xuất báo cáo hoặc xử lý từng nhóm riêng biệt.
Các bước thực hiện
Bước 1: Tạo cột phụ bên cạnh dữ liệu (ví dụ: cột C). Nhập vào ô C2 công thức: =COUNTIF(A:A,A2)=1 – trả về TRUE nếu không trùng, FALSE nếu trùng.

Bước 2: Kéo công thức xuống hết dữ liệu trong cột C.
Bước 3: Chèn 1 hàng trống ở đầu bảng (click chuột phải vào hàng 1 > Chèn 1 hàng lên trên).

Bước 4: Chọn ô C1, vào Dữ liệu > Tạo bộ lọc.

Bước 5: Nhấn vào biểu tượng bộ lọc ở C1: bỏ chọn FALSE để chỉ xem dữ liệu không trùng; hoặc bỏ chọn TRUE để xem dữ liệu trùng.

Lợi thế so với hàm UNIQUE: Bạn có thể lọc theo bất kỳ cột định danh nào (email, mã khách hàng, số điện thoại) thay vì toàn bộ hàng. Đây là cách linh hoạt nhất khi dữ liệu phức tạp.
Kinh Nghiệm Và Mẹo Thực Tế Khi Xóa Dữ Liệu Trùng
Luôn sao lưu trước khi xử lý
Sử dụng tổ hợp phím Ctrl + D (hoặc click chuột phải vào tab sheet > Nhân đôi) để tạo bản sao trước mọi thao tác xóa. Không có bước nào tốn ít thời gian hơn mà lại an toàn hơn thế.
Xác định rõ tiêu chí trùng lặp
Không phải lúc nào cũng cần xóa toàn bộ bản ghi trùng hoàn toàn. Hai dòng cùng email nhưng khác tên có thể là hai người khác nhau dùng chung email. Hãy xác định cột định danh duy nhất (mã khách hàng, số điện thoại) rồi mới lọc.

Xử lý dữ liệu lớn (trên 10.000 dòng)
Với sheet hàng chục nghìn dòng, công thức mảng có thể làm chậm file đáng kể. Giải pháp: sao chép dữ liệu sang sheet mới, áp dụng lọc một lần rồi làm việc trên bản đã lọc. Nếu cần tự động hóa, Google Apps Script là lựa chọn tốt nhất. Ngoài ra, nếu bạn cần trình bày kết quả phân tích dưới dạng tài liệu văn bản, hãy tham khảo Google Docs là gì và cách sử dụng để kết hợp hiệu quả trong quy trình làm việc.
Kiểm tra khoảng trắng ẩn
Đây là nguyên nhân phổ biến khiến các công thức không nhận ra dữ liệu trùng. Dùng hàm =TRIM(A2) để loại bỏ khoảng trắng thừa trước khi lọc, đặc biệt với dữ liệu nhập từ Form hoặc copy-paste từ nơi khác.
Bạn có thể tìm hiểu thêm Google Sites là gì và cách tạo website miễn phí nếu bạn muốn chia sẻ báo cáo dữ liệu dưới dạng trang web nội bộ.
Câu Hỏi Thường Gặp (FAQ)
Dữ liệu sạch là nền tảng cho mọi phân tích và quyết định kinh doanh đúng đắn. Áp dụng đúng kỹ thuật, bạn sẽ tiết kiệm hàng giờ làm việc thủ công mỗi tuần.






