Superbrugerforum på kbharkiv.dk (2016-2020)

Dubletter

Oprettet af
2020-05-12 07:21:21
Forfatter Indlæg
Skrevet af
2020-05-12 07:21:21
Hej alle
Undersøgelsen af 1930-protokollen gav et godt tjek af dubletter.

Derfor har jeg trukket samme liste for alle indtastninger.

Se dette link:
https://docs.google.com/spreadsheets/d/1Okt6ei123x6wg1ptIR96jDqMRdD1sMDjyuuOxHz1hPA/edit?usp=sharing

Forklaring:
På disse faner vises de begravelser som har samme løbenummer indenfor hver protokol.
Der bør ikke være to begravelser med samme løbenumer indenfor hver protokol.
Derfor er der potentielt en dublet.
Opgaven for Superbrugerne går ud på at finde de begravelser som er dubletter og slette så der kun findes en tilbage.
Oftest er der to begravelser, så vil vi beholde den bedst indtastede og slette den anden.
Sletning foregår vha postid på superbrugersiden. Kim ved hvordan.
Mange hilsner fra
Jeppe
Digitalarkivar ved Københavns Stadsarkiv
Skrevet af
2020-05-12 07:57:31
Her er en fra i går 11.5.2020:
https://www.kbharkiv.dk/sog-i-arkivet/sog-i-indtastede-kilder#/results?q1.f=lastname&q1.op=eq&q1.t=andersen&q2.f=firstnames&q2.op=eq&q2.t=karen%2520s%25C3%25B8rine&sortField=lastname&sortDirection=asc&postsPrPage=10&collections=1&type=advanced
Venlig hilsen Eva E
Skrevet af
2020-05-12 10:25:21
Vi har tidligere undersøgt mulige dubletter, nogle af dem skyldes fejltastning af løbenummer, nogle skyldes fejl i protokollen (samme løbenummer anvendt flere gange 7234A, 7234B osv.) og så dem, der skyldes dobbelt indscanning.
Jeg lavede for et år siden (2019-juli) en større gennemgang ud fra nogle lister, som Jeppe lavede dengang (se bilag).

Vi behøver vel ikke at lave hele den gennemgang nok en gang. Det må være nok at undersøge dubletter, hvor mindst en af posterne er tastet efter 2019-07-01
Skrevet af
2020-05-12 10:27:51
Hej BJørn og Eva
Nej, selvfølgelig skal vi ikke tjekke dem igen.
Jeg finder lige indtastningsdato frem så det kan være et kriterie.
Mange hilsner fra
Jeppe
Digitalarkivar ved Københavns Stadsarkiv
Skrevet af
2020-05-12 10:28:30
Hej Jeppe
Hvilken dato er listen trukket?
Da vi talte i tlf onsdag 7/5 var jeg færdig med listen for 1930, undtaget (2432-4218) 31 tomme sider som jeg taster nu.
Så alle 3 protokoller 1930 er rettet.

www.kbharkiv.dk/kildetaster/#/task/1/page/113473/done

På ovennævnte link, Evas post, ses at posten ikke er vist i udsnit på siden
Derfor skal begge poster ( postid: 333034 og 333032) slettes og siden 113473/1 åbnes og posten tastes igen med korrekt udsnit på siden.
Der var temmelig mange af disse fejlposter i 1930, så selve siderne skal tjekkes inden sletning af kun 1 post.

mh minna
Skrevet af
2020-05-12 10:30:31
Det var denne undersøgelse, som jeg henviste til
https://www.kbharkiv.dk/forum/koordinering/1850-jeppe-samme-lobenr-brugt-flere-gange?start=0
Skrevet af
2020-05-12 11:01:03
Jeg vil godt tegne mig for hele den gennemgang. Pr. 13. august 2019 var alt i orden efter den foregående undersøgelse. Gennemgangen af listerne dengang tog over 50 timer!
Listerne fra dengang indeholdt protokol, løbenr, for- og efternavn, dødsdato og link til de enkelte poster.
Det var gode lister at arbejde med!
Hvis du supplerer med indtastningsdato, så kan jeg i Excel sortere dem fra, hvor en eller flere er tastet efter f.eks. 1. august sidste år. Det kunne også gøres i sql, hvis man
1. lavede en indre sql med protokol og løbenr for alle dubletter
2. en ydre som fandt dem, hvor mindst en af dem var indtastet efter 1. aug 2019
3. endnu en ydre, som fandt de øvrige oplysninger frem
Det kan gøres, men er ikke så nemt
Skrevet af
2020-05-12 11:21:28
Kunne vi ikke få en liste, udvidet protokoller, i lb.nr-orden for at se manglende poster/sider?
Der er ikke mange "ureelle" poster i de nye protokoller, så vidt jeg har set.

mh minna


mh
Skrevet af
2020-05-12 11:35:05
Hej Bjørn og Jeppe

Har ikke forstand på sgl. mv.

Men kan I finde poster der er tastet, kan søges og ses i kildetasteren, men ikke er korrekt i udsnit på siden.