Forum på politietsregisterblade.dk (2011-2018)

Til Jeppe - Fejlretning - Dubletter

Oprettet af
2013-09-20 10:34:57
Forfatter Indlæg
Skrevet af
2013-09-20 10:34:57
Hej Jeppe.

Hvordan koordineres sletning af de dubletter som findes i de store områder med dubletter?

Når man finder en dublet, er der ofte mange dubletter på begge sider af dubletten. Her er det vigtigt at slette alle dubletter i området, og ikke kun den fejlmeldte dublet, for så kan vi ikke finde de store områder med dubletter.

Desuden er det praktisk at man kan gå en frem to forskellige steder og hele tiden finde dubletter. Hvis nogle dubletter i området er slettet, så er det svært at finde ud af hvor man skal gå en frem eller flere frem for at finde den næste dublet.

Det vil desuden være praktisk at lave en oversigt over de store områder med dubletter
( http://www.politietsregisterblade.dk/forum/koordinering-af-fejlrettelser/20969-til-jeppe-og-fejlrettere-omrader-med-dubletter ).

Det er spild af tid at indtaste en dublet.


——————————————————————

P.S.:
Siden bør ikke hoppe ned til en indtastning, når man ser rullen igennem for at finde fejl.
Med venlig hilsen Marianne
Skrevet af
2013-09-20 11:50:42
Kære Marianne,

i tirsdags talte jeg med Jeppe om dit arbejde med dubletter. Resultatet blev, at jeg ville prøve at lave en liste over mulige dubletter på station 1 og 7.

Jeg fik et udtræk fra databasen fra Jeppe, som jeg behandler i et regneark, så personer med (nøjagtigt) ens indtastede personnavn og fødselsdata bliver parret sammen, så begge ID-numre står overfor hinanden.

Hermed er det muligt at slå de to ID-numre op og konstatere, om der virkelig er tale om dubletter, fejlmelde den en med en henvisning til den anden dublet, og senere slette det fejlmeldte blad.

Er der blot et enkelt tegn, der er indtastet forskelligt, evt. pga. en tastefejl, fanges dubletten ikke.

Nogle få blade med ens almindelige navne er ikke dubletter, men forskellige personer.

En hel del er samme person, der blot har to eller flere blade.

Endelig er en (hel) del allerede fejlmeldt, enten som dublet eller som "flere blade på et billede (type 3) fejl. Her får man hurtigt at vide, om der evt. findes en brugbar dublet.

Med ca 150.000 personer på st.1 har jeg været nødt til at hakke listen over i 3 dele. Regnearkene bliv ret store, og ikke direkte egnet til mailforsendelse. Jeg har derfor lavet en "essens", der kun viser de sammenfald, der er fundet.

Som eksempel fandt jeg i går aftes for station 1, efternavn N-Å med ca 57000 blade 945 sammenfald. Dvs 1890 blade til kontrol. Jeg tjekkede lig, hvor mange allerede fejlmeldte dubletter der var: 862.

Så vidt jeg er orienteret, er det superbrugerne, der skal kontrollere og slette den ene dublet. Desværre er dobbeltarbejdet med indtastning af adresser mv. allerede sket på næsten alle stikprøver, jeg har lavet.

Skal vi undgå dobbelt indtastning, er det nok mest fornuftigt at analysere de ruller, hvor der færrest "komplet registreret" blade. Dem er der ikke mange af på st.1.

Rulle 7 kom desværre ikke med fra Jeppe i første omgang, men nu har jeg nogenlunde tjek på, hvordan listerne skal laves, så hvis du vil have en sådan, kan jeg godt lave den.

Venlig hilsen

Henrik Larsen
Skrevet af
2013-09-20 12:04:18
Hej Henrik

Det er kun fejlretterne som kan slette dubletter.

Vi er vist kun to personer som sletter dubletter i områder uden for de områder hvor der skannes.

Jeg sletter i øjeblikket dubletter på station 7, i slutningen af rulle 10. I starten af rulle 11 er rulle 10's dubletter. Når jeg er færdig, kan jeg godt bruge et udtræk af databasen, så jeg kan se om jeg har fået slettet alle dubletter.

Jeg vil meget gerne være med til at udpege områder hvor der skal slettes dubletter.

Da jeg søger en del, opdager jeg undertiden en dublet. Det har jeg så skrevet i forum, men det står lidt spredt. Andre har også skrevet om dubletter i forum.
Med venlig hilsen Marianne
Skrevet af
2013-09-20 12:09:40
Hej Henrik

Måske kan du melde dig som fejlretter af områder med dubletter, så du kan deltage i dette fejlretningsarbejde?


—————————————————-

Man skal være meget forsigtig, når man sletter dubletter.

Jeg går først registerbladene igennem og fejlmelder de dubletter som jeg vil slette. Hvis der er en fejlmelding på det blad som jeg ikke vil slette, så fjerner jeg fejlmeldingen. Derefter går jeg igen de samme registerblade igennem, kontrollerer en gang til, og så sletter jeg dubletten.
Med venlig hilsen Marianne
Skrevet af
2013-09-20 12:27:05
Hov! jeg fik vist blandet mig i min navnebrors indlæg.

Undskyld

Henrik Larsen
Skrevet af
2013-09-20 13:12:07
Hej Henrik L.

Jeg har fået et udtræk fra databasen til station 1, rulle 0004:

registerblad_id
fornavne
efternavn
foedselsdag
foedselsmaaned
foedselsaar
udfyldelse_dag
udfyldelse_maaned
udfyldelse_aar

Dette udtræk kan jeg bruge til at finde områder med dubletter. Jeg kan jo selv sortere data på forskellige måder ( http://blog.magenta-aps.dk/wp-content/uploads/2011/03/Calc_Kursus.pdf (side 41) ). Der vil være mange med samme navn 2 gange i områder med dubletter.

Jeg skanner registerblade i den rulle, så derfor har jeg også slettet dubletter dér for lang tid siden.
Med venlig hilsen Marianne
Skrevet af
2013-09-21 08:42:03
Jeg har skrevet til Jeppe i går, og bedt ham sende mig rulle 7.
Når jeg har den, skal jeg nok producere listen
Venlig hilsen

Henrik Larsen
Skrevet af
2013-09-21 09:07:19
Hej Henrik L.

Fint. :)

Det er dubletter på station 7 rulle 10 og 11 som jeg arbejder med. Lige i øjeblikket kan jeg klikke mig en frem to steder og hele tiden finde dubletter. Der har også været tripletter.

Jeg slettede i rulle 10, men så kom jeg i går til et område med mange indtastninger i rulle 10, og så sletter jeg i rulle 11 i stedet.
Med venlig hilsen Marianne