-
pakiety:
stringdist
,blocking
(githubncn-foreigners/blocking
),reclin2
.
- Łączenie danych:
- deterministyczne
- probabilistyczne
- Porównywanie tekstów
- miary odległości
- prowadzenie do pakietu
stringdist
- Wprowadzenie do pakietu
reclin2
- Blokowanie rekordów:
- idea
- przykłady z pakietem
reclin2
iblocking
- Probabilistyczne łączenie rekordów
- metody nienadzorowane
- metody nadzorowane
- R
- pakiety
stringdist
,reclin2
,blocking
.