Klucz kandydujący jest kombinacją atrybutów, które mogą być jednoznacznie używane do identyfikowania rekordu bazy danych bez odwoływania się do jakichkolwiek innych danych. Każda tabela może mieć jednego lub więcej kandydatów. Jeden z tych kluczy kandydujących jest wybrany jako klucz podstawowy tabeli. Tabela zawiera tylko jeden klucz podstawowy, ale może zawierać kilka kluczy kandydujących. Jeśli klucz kandydujący składa się z dwóch lub więcej kolumn, nazywany jest kluczem złożonym.
Właściwości klucza kandydata
Wszystkie klucze kandydujące mają pewne wspólne właściwości. Jedną z właściwości jest to, że przez cały okres ważności klucza kandydata atrybut użyty do identyfikacji musi pozostać taki sam. Innym jest, że wartość nie może być pusta. Wreszcie klucz kandydujący musi być unikalny.
Na przykład, aby jednoznacznie zidentyfikować każdego pracownika, firma może użyć numeru ubezpieczenia społecznego pracownika. Jak widać, są ludzie o tych samych imionach, nazwiskach i pozycji, ale żadna z dwóch osób nigdy nie ma tego samego numeru ubezpieczenia społecznego.
| Numer ubezpieczenia społecznego | Imię | Nazwisko | Pozycja |
|---|---|---|---|
| 123-45-6780 | Craig | Jones | Menedżer |
| 234-56-7890 | Craig | Beal | Współpracownik |
| 345-67-8900 | Sandra | Beal | Menedżer |
| 456-78-9010 | Trina | Jones | Współpracownik |
| 567-89-0120 | Sandra | Kowal | Współpracownik |
Przykłady kluczy kandydatów
Niektóre rodzaje danych łatwo nadają się jako kandydaci:
- International Standard Book Numbers-ISBNs jednoznacznie identyfikują książki i powiązane media. Wydawanie numerów ISBN jest ściśle regulowane przez strażników branży, a numery ISBN zazwyczaj nigdy nie są ponownie wykorzystywane przez wydawców.
- Numery kont bankowych - większość banków nie przetwarza numerów kont.
- Numery seryjne - chociaż numery seryjne nie są regulowane w różnych branżach, w kontekście jednego dostawcy numer seryjny powinien być zawsze niepowtarzalny.
- Numery licencji kierowcy - zwykle numery te nie są duplikowane. Jednak osoba przechodząca ze stanu do stanu może mieć więcej niż jeden numer DL.
- Krajowi ID-lekarze i inni licencjonowani dostawcy usług medycznych mają co najmniej jedną unikatową dla nich informację NPI, wydaną przez amerykański Departament Zdrowia i Opieki Społecznej.
Jednak niektóre rodzaje informacji, które mogą wydawać się dobrymi kandydatami, okazują się problematyczne:
- Numery telefonów - większość operatorów przetwarza numery telefonów, a poszczególni abonenci mogą mieć jednocześnie kilka numerów telefonów.
- Uniwersalne kody cenowe - UPC są unikalne, ale właściciel bloku UPC może dowolnie przetwarzać produkty.
- Numery medyczne-MRN są zwykle wydawane na poziomie szpitala, bez żadnych krajowych wytycznych
- Numery ubezpieczenia społecznego - choć teoretycznie są unikatowe, stacje SSN są poddawane recyklingowi, a oszustwa SSN są na tyle powszechne, że powodują problemy z identyfikacją w dużych zbiorach danych. (W kontekście pracodawcy, który sprawdza numery SSN, to wyzwanie nie stanowi problemu).




