Skip to main content

Usuń zduplikowane rzędy danych w programie Excel

Excel - Jak skopiować co drugą linijkę z danych - widzowie #85 (Kwiecień 2025)

Excel - Jak skopiować co drugą linijkę z danych - widzowie #85 (Kwiecień 2025)
Anonim
01 z 02

Usuń zduplikowane rekordy danych w programie Excel

Programy arkusza kalkulacyjnego, takie jak Excel, są często używane jako bazy danych dla takich elementów jak zapasy części, rekordy sprzedaży i listy mailingowe.

Bazy danych w programie Excel składają się z tabel danych, które są zwykle zorganizowane w wiersze danych zwanych rekordami.

W zapisie dane w każdej komórce lub polu w wierszu są powiązane - takie jak nazwa firmy, adres i numer telefonu.

Częstym problemem występującym w miarę powiększania się bazy danych jest powielanie rekordów lub wierszy danych.

To duplikowanie może wystąpić, jeśli:

  • Całe rekordy są wprowadzane do bazy danych więcej niż jeden raz, co daje dwa lub więcej identycznych rekordów
  • Wiele rekordów ma jedno lub więcej pól - takich jak nazwa i adres - zawierających te same dane.

Tak czy inaczej, duplikaty rekordów mogą powodować cały szereg problemów - takich jak wysyłanie wielu kopii dokumentów do tej samej osoby, gdy informacje o bazie danych są używane w korespondencji seryjnej - dlatego warto skanować i usuwać duplikaty rekordów podstawa.

Podczas gdy łatwo jest wybrać duplikaty rekordów w małej próbce, takiej jak na powyższym obrazie, tabele danych mogą łatwo zawierać setki, jeśli nie tysiące rekordów, co bardzo utrudnia wybieranie duplikatów - szczególnie częściowo pasujących rekordów.

Aby ułatwić to zadanie, program Excel ma wbudowane narzędzie do obsługi danych, które nie jest zaskakujące. Usuń duplikaty, które można wykorzystać do znalezienia i usunięcia identycznych oraz częściowo pasujących rekordów.

Jednak sposób Usuń duplikaty narzędzie jest zaprojektowane, identyczne i częściowo pasujące rekordy należy traktować oddzielnie.

To dlatego, że Usuń duplikaty Okno dialogowe wyświetla nazwy pól dla wybranej tabeli danych i wybierasz pola, które mają być uwzględnione w wyszukiwaniu pasujących rekordów:

  • W przypadku identycznych rekordów szukaj wszystkich pól - pozostaw znaczniki wyboru obok wszystkich nazw kolumn lub pól;
  • W przypadku częściowo pasujących rekordów pozostaw znaczniki wyboru obok tylko tych pól, które mają zostać dopasowane.

Nazwy pól a litery kolumn

Jak wspomniano, Usuń duplikaty Narzędzie składa się z okna dialogowego, w którym wybierasz, które pasujące pola chcesz wyszukać, zaznaczając odpowiednie nazwy pól lub kolumn.

Informacje wyświetlane w oknie dialogowym - nazwy pól lub litery kolumn - zależą od tego, czy dane zawierają wiersz nagłówków - lub nagłówki - na górze tabeli danych, jak widać na powyższym obrazku.

Jeśli tak - upewnij się, że opcja po prawej stronie okna dialogowego - Moje dane mają nagłówki - jest wyłączone, a Excel wyświetli nazwy w tym wierszu jako nazwy pól w oknie dialogowym.

Jeśli twoje dane nie mają wiersza nagłówka, w oknie dialogowym pojawią się odpowiednie litery kolumn w oknie dialogowym dla wybranego zakresu danych.

Ciągły zakres danych

Dla Usuń duplikaty narzędzie do poprawnego działania, tabela danych musi być ciągłym zbiorem danych - to znaczy, że nie może zawierać żadnych pustych wierszy, kolumn ani, jeśli w ogóle jest to możliwe, pustych komórek znajdujących się w tabeli.

Brak pustych pól w tabeli danych jest dobrą praktyką, jeśli chodzi o zarządzanie danymi w ogóle, a nie tylko podczas wyszukiwania duplikatów danych. Pozostałe narzędzia danych Excela, takie jak sortowanie i filtrowanie, działają najlepiej, gdy tabela danych jest ciągłym zbiorem danych.

Usuń zduplikowane rekordy danych Przykład

Na powyższym rysunku tabela danych zawiera dwa identyczne rekordy dla A. Thompson i dwa częściowo pasujące rekordy dla R. Holt - gdzie wszystkie pola pasują do siebie z wyjątkiem numeru ucznia.

Kroki wymienione poniżej szczegółowo opisują sposób korzystania z Usuń duplikaty narzędzie danych do:

  1. Usuń drugi z dwóch identycznych rekordów dla A. Thompson .
  2. Usuń drugi częściowo pasujący rekord dla R. Holt .

Otwieranie okna dialogowego Remove Duplicates

  1. Kliknij dowolną komórkę zawierającą dane w przykładowej bazie danych.
  2. Kliknij Dane zakładka na wstążce.
  3. Kliknij na Usuń duplikaty ikona, aby podświetlić wszystkie dane w tabeli danych i aby otworzyć Usuń duplikaty Okno dialogowe.
  4. The Usuń duplikaty Okno dialogowe wyświetla wszystkie nagłówki kolumn lub nazwy pól z naszej próbki danych
  5. Znaczniki wyboru obok nazw pól wskazują, które kolumny Excel spróbuje dopasować w poszukiwaniu duplikatów rekordów
  6. Domyślnie po otwarciu okna dialogowego wszystkie nazwy pól są odznaczone

Wyszukiwanie identycznych rekordów

  1. Ponieważ w tym przykładzie szukamy całkowicie identycznych rekordów, zaznaczymy wszystkie nagłówki kolumn
  2. Kliknij dobrze

W tym momencie należy zobaczyć następujące wyniki:

  • Okno dialogowe powinno zostać zamknięte i zastąpione komunikatem: Znaleziono 1 duplikat i usunięto; Pozostaje 7 unikalnych wartości.
  • Wiersz zawierający duplikat A. Thompson rekord zostanie usunięty z bazy danych
  • Mimo że istnieją dwa częściowo pasujące rekordy dla R. Hol t, ponieważ nie wszystkie pola są dopasowane - numer ucznia dla dwóch rekordów jest inny - Excel uważa, że ​​jest to unikalny rekord danych
02 z 02

Znajdź i usuń częściowo pasujące rekordy z usunięciem duplikatów

Sprawdzanie jednego pola na raz

Ponieważ program Excel usuwa tylko rekordy danych, które dokładnie pasują do wybranych pól danych, najlepszym sposobem znalezienia wszystkich częściowo pasujących rekordów danych jest usunięcie znacznika wyboru tylko dla jednego pola na raz, tak jak w poniższych krokach.

Kolejne wyszukiwania rekordów pasujących do wszystkich pól z wyjątkiem nazwy, wieku lub programu usunie wszystkie możliwe kombinacje dla częściowo pasujących rekordów.

Wyszukiwanie częściowo pasujących rekordów

  1. Kliknij komórkę zawierającą dane w tabeli danych, jeśli to konieczne
  2. Kliknij Dane zakładka na wstążce.
  3. Kliknij na Usuń duplikaty ikona, aby podświetlić wszystkie dane w tabeli danych i aby otworzyć Usuń duplikaty Okno dialogowe.
  4. Wszystkie nazwy pól lub nagłówki kolumn dla tabeli danych są zaznaczone.
  5. Aby znaleźć i usunąć rekordy, które nie pasują do każdego pola, usuń znacznik wyboru oprócz nazw pól, które program Excel ma ignorować.
  6. W tym przykładzie kliknij pole wyboru obok legitymacja studencka nagłówek kolumny, aby usunąć znacznik wyboru.
  7. Program Excel będzie teraz wyszukiwać i usuwać rekordy, które mają pasujące dane w pliku Nazwisko , Inicjał , i Program pola.
  8. Kliknij dobrze
  9. Okno dialogowe powinno zostać zamknięte i zastąpione komunikatem: Znaleziono 1 duplikat i usunięto; Pozostaje 6 unikalnych wartości.
  10. Wiersz zawierający drugi rekord dla R. Holt z identyfikatorem Studenta z ST348-252 zostaną usunięte z bazy danych.
  11. Kliknij dobrze aby zamknąć okno komunikatu

W tym miejscu przykładowa tabela danych powinna być wolna od wszystkich duplikatów danych.