Domov

Status animarum v računalniku

dr. Tomaž Pisanski

  1. Nujnost prenosa arhivskih podatkov na medije, ki so primerni za računalniško obdelavo, je bila že večkrat podrobno utemeljena, zato tu ne bomo zgubljali časa za dodatno utemeljevanje te potrebe. Nasprotno, prikazali bomo nekaj problemov in pomislekov, ki žal ta projekt prvovrstnega nacionalnega pomena upočasnjujejo, kljub številnim in jasnim potrebam za čimprejšnjo realizacijo.
  1. Status animarum kot podatkovna zbirka. Kdorkoli se le malo spozna na podatkovne zbirke in je že videl kakšen Status animarum, je najbrž opazil, da gre v bistvu za podatke, ki so bili že načrtovani v obliki, ki je zelo blizu računalniškim bazam podatkov. Podatki so vpisani v posebne rubrike, z jasnimi naslovi. Vrstice ustrezajo zapisom (record) podatkovne zbirke (data base.)
  1. Relacijske zbirke podatkov. Teorija zbirk podatkov pozna več tipov takšnih zbirk: mrežne, hierarhične, relacijske itd. V osemdesetih so se najbolj uveljavile relacijske zbirke podatkov. Zanje so bili izdelana tudi orodja, ki so dandanes dostopna na vsakem osebnem računalniku. Takšna orodja so npr. DBASE, Paradox, Access, itd.
  1. Problemi in napake pri prenašanju podatkov v računalnik. Do napak je vselej prihajalo, prihaja in bo prihajalo. S tem žalostim dejstvom se moramo sprijazniti in nanj računati. Naša naloga pa je, da se napakam po možnosti izognemo, zmanjšamo verjetnost njihovega nastanka, olajšamo njihovo odkrivanje in odpravljanje ter zmanjšamo možnost škodljivega vpliva napak. Zato moramo seveda razumeti mehanizme, ki povzročajo napake.
  1. Prenos analognih podatkov v digitalno obliko. Kakorkoli prenašamo vire v računalnik, je kopija vedno manj informativna od originala. Nujno zgubimo del informacije (npr. nikoli ne moremo popolnoma prenesti vonja ali hrapavosti papirja, ali pa barve ter kemijske sestave črnila, itd.) Jasno je, da bi bilo najbolje prefotografirati vse vire ter jih shraniti na zgoščenkah. Če to ni mogoče, je potrebno najprej vir prefotopirati ali fotograifrati in potem delati naprej na kopiji vira. Pomebno je, da se takšna kopija evidentira, se original shrani in zapre za javnost in se potem vse morebitne kasnejše uporabnike napoti k imetniku kopije po nadaljnjo delo. Zato predlagam, da se vedno, ko se dokumenti kopirajo, nujno en izvod kopije shrani ob originalu.
  2. Časovna dinamika zapisov. Pri statusu je skoraj nemogoče popolnoma ohraniti časovno dinamiko zapisovanja. Že original jo včasih delno zabriše in jo je mogoče včasih rekonstruirati s skrbnim, skoraj detektivskim delom. (Npr. iz pisave ali barve črnila, obledelosti zapisa, položaja besed in znakov je mogoče sklepati na časovni redosled zapisov ali posameznih dogodkov, opomb itd.) Pri digitalizaciji se lahko pomembni deli informacije izgubijo. Podatki so pogosto prečrtani, dopolnjeni, včasih so zapisani izven določenih rubrik, ali pa je popolnoma jasno, da ne sodijo v rubriko, v kateri jih najdemo.
  3. Preseganje tabelarične oblike. Pogosto je zapisovalec poskušal presegati tabelarično obliko in vpisati informacijo, ki ne sodi v nobeno od predpisanih rubrik. Takšne zapise je nemogoče prepisati brez izgube dela informacije.
  4. Znaki, okrajšave, simboli. Pisec je včasih diskretno skril v zapis občutljivo informacijo, ki naj bi ostala skrita nepoučenemu. Tako najdemo ponekod posebne simbole in znake, ki jih je težko nedvoumno tolmačiti, še teže pa jih je smiselno prepisati v računalnik.
  1. Napake originalnih podatkov. Napake so lahko prisotne že pri originalnih podatkih. Lahko gre za pomote ali nedoslednost pri zapisovanju imen in priimkov, pogosto manjka kakšen datum. Včasih ni jasno, ali je oseba umrla doma ali je odšla od doma. Včasih se ne ve, ali je bila oseba rojena v hiši, ki jo status obravnava, ali se je tja doselila.
  1. Napake pri prepisovanju podatkov. Največ napak nastane zaradi nečitljivih podatkov, ko je prepisovalec prisiljen ugibati. Dodatne težave povzroča jezik in pa starinska pisava (gotica). Težave povzroča tudi nedosledna transkripcija. Prepisovalec si nehote prizadeva popravljati ‘napake’ in ‘pomanjkljivosti’ zapisovalca. Tu lahko naredi napako in narobe razume namen zapisovalca. Namesto originalnih podatkov zapiše svoje interpretacije. To je lahko slabo, saj potem prepisani podatki niso zanesljivi in jih morajo vsi, ki jih želijo resno uporabljati, preverjati z orginalom. Prepisovalec se lahko zaradi časovne, finančne ali kakšne drugačne stiske odloči, da bo prepisovanje ‘poenostavil’ in zapisuje samo podatke, ki so zanj relevantni, npr. rodoslovci samo rodoslovne podatke. Opombe se opuščajo.
  1. Ločevanje podatkov od interpretecij. Strogo moramo ločevati podatke od interpretacije podatka. Včasih lahko manjkajoči podatek rekonstruiramo, vendar moramo v posebnih poljih za opombe takšno reknostrukcijo nedvoumno opisati. Tja tudi vnašamo vse interpretacije ter ekspertno mnenje.
  1. Izbira računalniškega orodja. Pri izbiri smo dali prednost splošnemu pred posebnim. To je lahko s stališča ekspertov, ki imajo že izdelana posebna orodja slabše, vendar je za to vrsta razlogov. Splošna orodja uporabljajo formate zapisov, ki omogočajo enostavno prevajanje in izmenjavo podatkov. Splošna orodja so pisana za ‘vsakogar’, zato so prijazna za uporabo, medem ko za uporabo posebnih orodij potrebujemo posebna znanja in so manj prijazna za uporabo, saj predvidevajo več znanja uporabnikov. Posebna orodja se prodajajo v manj izvodih in so bolj zahtevna, zato so nujno dražja. Včasih so omejena na posebne tipe računalniških sistemov in so s tem nujno dostopna manjšemu krogu uporabnikov. Ker bo prenos Statusov na računalniške medije nujno potekal hkrati na več računalnikih z množico prepisovalcev, je nujno izbrati orodje, ki je lahko vsakomur na razpolago. V ta namen smo se odločili za relacijski model zbirke podatkov, konkretno za Access. Samo orodje ni bistveno, saj bo mogoče podatkovje prevesti v širše dostopno obliko.
  1. Status - pilotski del, nekaj značilnosti. Sodobna orodja, kakršno je npr. Access omogoča sorazmerno preprosto programiranje, ki uporabniku daje možnost kontroliranega vnosa podatkov. S tem smo skušali zaščititi uporabnika pred lastnimi napakami. To nam je le delno uspelo. Namesto formularjev za vnos, so uporabniki raje videli možnost neposrednega vnosa v tabelo. Med vnašanjem začetnih podatkov smo po izčrpnih razgovorih z vnašalci večkrat dopolnili podatkovni model. Vnesena je približno ena knjiga podatkov. Zdaj je čas, da se še enkrat soočimo s prednostmi in pomanjkljivostmi tega modela, ga dopolnimo in potem ponudimo v širšo uporabo. Žal se pri tem pojavi problem finaciranja. Resna predelava programa bi zahevala določena finančna stredstva, ki pa ta hip nikjer niso na voljo. Trenutni Status omogoča, da se v posameznih rubrikah avtomatsko pojavijo po frekvencah urejena imena, tako da uporabniku ni potrebno ponovno tipkati že vnesenih imen oz. priimkov, ampak jih lahko izbira iz dinamičnega menija. Delno so na voljo že prvi programi, ki preračunavajo sorodstvene zveze in iščejo podvojitve oseb v zbirki. Načrtali smo nekaj orodij, ki olajšajo vnašanje podatkov. Na primer, na voljo so imena in priimki z njigovimi frekvencami pojavitve. Predvsem pri priimkih in imenih krajev lahko uporabljamo frekvence za odkrivanje tipkarskih napak. Na osnovi testnih izpisov bo mogoče odpravljati vnesene napačne podatke, primerjati prenesene podatke z originalom ter rekonstruirati nekatere manjkajoče podatke. Prav teko bodo na razpolago statistično sumarni izpisi, ki bodo omogočali računanje povprečnih starosti ob poroki, velikosti družin, itd. Poseben modul bo omogočil prepis podatkovja v obliko GEDCOM, ki bo potem na voljo v rodoslovne namene.
  1. Različne uporabe prenesenih podatkov. Zavedati se moramo, da podatki iz Statusov niso namenjeni zgolj rodoslovni uporabi. Že zdaj jih uporabljajo v zgodovinsko etnografske namene (Ravnik, Hudales, Fikfak, itd.). Zato je pomembno, da prepisani podatki ohranijo vso potrebno informacijo in ne le tisto, ki bi zanimala posameznega rodoslovca.
  1. Kako naprej? Nujno bi morali prijaviti projekt prepisa in obdelave Statusov za raziskovalni projekt. Če bi rodoslovci dali del svojega prostega časa za prepis podatkov na računalniške medije, bi lahko iz tako zasluženega denarja financirali društveno glasilo ter morda še nekatere druge izdatke.
Prispelo gradivo za Drevesa
Opomba urednika: Drevesa izidejo, ko se nabere prispevkov za vsaj 36 strani. Poleg ljubiteljskih prispevkov je zelo zaželeno, da ima vsaka številka vsaj nekaj strokovnih prispevkov. V začetku leta...
Rodovnik in računalnik.
Opomba: Ta prispevek je bil objavljen v prvi številki glasila slovenskih rodoslovcev, ki je izšla aprila 1994, torej še pred ustanovitvijo društva. Kot laik ne bi rad posegal v različne...
Kartografija
Na tej strani najdete kratke opise vsebin portalov in spletnih orodij za lociranje zemljepisnih imen in izdelavo enostavnih preglednih kart, ki so uporabne za domoznanske in rodoslovne namene....
Slovensko rodoslovje
Od kdaj? Od začetka človeštva. Samo da takrat ni bilo slovensko. Slovensko je odkar si rečemo Slovenci. To pa zgodovinsko gledano še ni dolgo. Rodoslovje pa je vedno spremljalo človeštvo in ga bo...
Main page Contacts Search Contacts Search