Programsko primerjanje rodovnikov

Tako bi lahko prevedli angleški Record matching software. Šlo pa naj bi za programsko konzultacijo zunanjih, na spletu dosegljivih, referenčnih rodoslovnih zbirk podatkov.

V slovenskem rodoslovnem društvu smo se v samem začetku zavedali, kako koristno je lahko primerjanje področja raziskovanj med kolegi rodoslovci.

Pred dobrimi desetimi leti smo člani rodoslovnega društva začeli rezultate svojih raziskav združevati v skupno referenčno datoteko. Namen je očiten. Vsak rodoslovec je sorodnik drugega rodoslovca in njuna rodovnika se morata prej ali slej povezati. Tega stavka ni treba jemati dobesedno, saj mnogi tudi ob zelo poglobljenih in razširjenih raziskavah ne bodo našli stične osebe. Vseeno pa je res, da bi prej ali slej moralo priti do ene ali več povezav v rodovniku dveh oseb, ki se takega 'sorodstva' ne zavedata.

Za odkrivanje morebitne povezave pa rodovnik v računalniški obliki nudi neprimerno več možnosti in poenostavitev kot so jih nudile spisane ali izrisane rodoslovne evidence. In ravno pomoč pri ugotavljanju stičnih točk ali sklopov naj bi bila največja korist, kakršno v društvu iščejo pridruženi člani. To je tudi tisto, čemur je društvo ves čas svojega delovanja posvečalo največ pozornosti.

Omenjena kumulativna datoteka je takoj potrdila pričakovano vrednost. Še vedno pa je bila dostopna samo tistim članom, ki so zanjo vedeli in so jo lahko konzultirali na društvenem računalniku. Ker so bil med člani tudi nekateri kolegi, ki pri delu niso uporabljali računalnika, smo se odločili natisniti indeks rodovniško povezanih oseb.

Ta spisek je vsako osebo predstavljal z imenom, priimkom ter datumom in krajem rojstva. Urejen je bil po abecedi. Če je iskalec med vpisi našel stično osebo, se je povezal z dajalcem in sledila je temeljitejša primerjava in izmenjava podatkov. S tem pa vedno pridobita oba - iskalec in dajalec.

Datoteka je takrat štela okrog 120.000 oseb in v dveh stolpcih popisan indeks s po 120 vpisi na strani je zasedal okoli 1000 A4 strani na neskončnem papirju.

Ta indeks je takrat le malokdo uporabil. Pred kakimi petimi leti smo takratni indeks začeli objavljati na spletu in ga občasno osvežili. Danes vsebuje skrajšane zapise za prek 1,300.000 oseb. Če bi ga hoteli natisniti, bi z njim napolnili vsaj 10.000 strani A4 formata. Indeksu oseb smo pred kakimi tremi leti dodali še indeks porok. Ta indeks je važna dodatna informacija pri iskanju morebitnih stičnih točk pri raziskovanju. Tudi ta je urejen po abecedi in je zato vsak par zapisan dvakrat, enkrat po priimku moža in drugič po priimku žene.

Zraven vsakega vpisa je tudi naveden dajalec. To je tisti, ki je podatke iz svoje datoteke ponudil na ogled. Z njim se mora povezati tisti, ki je po indeksu ugotovil prekrivanje svojega dela z nekom drugim. Posledica je že omenjena korist za oba. Postopek pa je po spletni objavi hitrejši, vsakomur dostopen, izmenjava podatkov pa tudi mnogo lažje izvedljiva. Posledično pa je v takih primerih odveč iskanje po arhivih in s tem obraba dragocenega originalnega gradiva.

Referenčni indeks bi bilo torej smiselno konzultirati ob vsaki dodani osebi. Še bolj praktično bi bilo, da bi se primerjava z referenčno datoteko opravila s programsko rutino. Prav to je tisto, kar je vgrajeno v nekatere rodoslovne programe. Ta programski dodatek najbolj razglaša firma MyHeritage (Family Tree Builder). Sprotno programsko primerjanje podatkov o vneseni osebi z vsemi že vpisanimi je zagotovo prav tisto, o čemer lahko sanja vsak rodoslovec. Ta primerjava je lahko uspešna samo takrat, ko program prepozna zares pravo osebo. Podatke o tej osebi je moral nekdo pred tem vpisati, po možnosti v povezavi s sorodstvom. Ne samo vpisati, svoje podatke je moral prepustiti firmi, ki te podatke pridruži v primerjalno zbirko. Med največjimi zbiralci rodovniških datotek so Ancestry, FamilySearch in MyHeritage. Te tri naj bi bile največje svetovne organizirane zbirke, ki pa še ne gradijo skupne referenčne kumulative. To pomeni, da bi moral radovednež konzultirati vsako od njih, kadar bi se želel prepričati, če ni njegovo področje raziskovanja stično s področjem nekoga drugega.

Pa tudi te milijardne zbirke niso vse. Obstajajo še take, ki nastajajo bolj ali manj na nacionalni ravni. V to skupino bi lahko uvrstili vse tisto, kar se oblikuje in združuje okrog nacionalnih organizacij. Vsaka od teh ima svoje značilnosti in posebnosti. Sam imam med slednjimi največ izkušenj s servisom Geneanet. Ta temelji na francoskih začetkih, ki pa se je zaradi svojih nenehno dodajanih izboljšav in razširitev priljubil tudi izven francoskih meja. Nekoliko manj vleče nase nemški bazen. Tem bolj ali manj uspešno sledijo ostale evropske organiziranosti. Za primerjavo je objava o povezavah.

Težko bi bilo narediti kakovostno primerjavo nad vso to ponudbo, ki se za povrh hitro razvija in spreminja. Mislim, da je samo servis orjaka Ancestry pretežno plačljiv.

Kljub nedosegljivemu obsegu zalog teh vodilnih organizacij, je za nacionalno rabo najbolj ali vsaj najprej uporaben domači ponudnik. Ta je za Slovence zagotovo referenčni indeks oseb in porok, katerega občasno dopolnjuje Slovensko rodoslovno društvo (SRD). Prej omenjeni velikani bi nudili enak ali boljši servis samo, če bi vsi tisti, ki so svoje podatke ponudili v objavo na straneh SRD, svoje rezultate posredovali tudi prej omenjenim. To pa naredijo le redki Slovenci. V svetovnih bazenih je kljub njihovemu nedosegljivemu bogastvu manj 'slovenske primerljivosti', katero nudi preprosti referenčni indeks SRD.

Noben od omenjenih sistemov pa še ni rešil problematike različnih kodnih tabel, ki ne prepoznajo enakosti zapisov posebnih nacionalnih znakov. Pri nas so to zlasti čšž. Pa ne samo to. Računalnik največkrat ne prepozna enakosti vseh možnih različnih zapisov imen in priimkov. Vsak malo bolj izkušen rodoslovec se zaveda, da je določeno ime ali priimek v izvirnikih vpisan tudi na deset in več različnih načinov. Teh računalnik ne zna prepoznati. Tone in Anton za računalnik nista enakovredna atributa. Ta težava je prisotna tudi v referenčnem indeksu SRD. Radovednež se lahko prepriča ob iskanju na primeru Maček in mnogih drugih. Kadar pa računalnik poskuša razširiti primerjanje z 'razumevanjem' aliasov, nam navado postreže s kopico neuporabnih primerjancev. Ravno to je za zdaj nadlega in ne korist.

Vseeno bi slovenskim rodoslovcem za zdaj najbolj koristilo, če bi programska rutina sproti opozorila na možno enakost z že popisano osebo in s tem družino. To pomeni, da bi se primerjanje z vsebino lastne datoteke, kar je sestavna vsakega rodoslovnega programa, razširili s primerjavo z eno ali več referenčnih datotek. Že samo to bi bila izdatna korist. Saj so sanje o svetovnem rodovniku še vedno samo sanje.  

Main page Contacts Search Contacts Search