Podstawe źródła wiedzy: Metryki.
RODZAJE INFORMACJI KTÓRE CHCE WPROWADZIĆ DO BAZY DANYCH
ŹRÓDŁA METRYKALNE
PONIŻSZA CZĘŚĆ WYMAGA AKTUALIZACJI I SPROSTOWANIA
WSTĘPNA WIZJA POWIĄZAŃ INFORMACJI W BAZIE DANYCH
(Kilka skrótów stosowanych w treści poniżej skróty:
[1] -oznacza że można tylko jeden raz coś przyporządkować
[n]-oznacza że można wiele razy coś przyporządkować)
Plansza „I” - RELACJE MIĘDZYOSOBOWE
PONIŻSZA CZĘŚĆ WYMAGA AKTUALIZACJI I SPROSTOWANIA
„Arboretum Rodów” - Zapewne nazwa ulegnie jeszcze zmianom, aczkolwiek nie o nazwę tu się rozbiega, nie mniej, drzewa genealogiczne zazwyczaj dotyczą więcej niż jednego rodu, więc mówiąc potocznie „Drzewo Genealogiczne Cisowskich” świadomie lub nie świadomie odnosimy się do potomków jakiegoś Cisowskiego, którego drzewo właśnie budujemy. Problem ten znika w moim wypadku, gdyż odnoszę się na samym początku iż moje zainteresowanie dotyczy wielu rodów, a dopisek arboretum określa że są one jakoś tam z sobą powiązane. :)
Na rynku, mrowie stricte genealogicznych programów, i tak: każdy swe zalety, jak i wady ma, można się zrzec pewnych potrzeb i korzystać z tegoż co dostępne, jednakowoż wiele przyjemniej przechowywać swoje dane w sposób zamierzony. Genealogią zajmuję się praktycznie od początku XXI wieku, korzystając na początku z dobroci arkuszy papieru, później Excel, Ages!, SmartDraw, Drzewo Genealogiczne PL-SOFT, GenoPro, MoiKrewni, GeneWeb, Ancestry, MyHeritage, FamilyTreeBuilder, GeneaNet, yEd yWorks; w zasadzie jeśli chodzi o sposób gromadzenia informacji jestem zadowolony z MyHeritage, poza pewnymi wyjątkami, atoli brakuje mi pewnych funkcjonalności, dla tegoż postanowiłem stworzyć środowisko dla moich potrzeb, jestem w pełni świadom że utracę wówczas „Smart Matches” - inteligentne dopasowania, aczkolwiek posiadanie własnej lokalnej bazy, nie ogranicza części danych udostępniania w sieci korzystając z dobrodziejstw różnorakich platform.
Program „Arboretum Rodów” jest na razie (marzec 2016) w fazie projektowej, jeszcze nic nie powstało na razie wstępne założenia czego od niego oczekuję. FAZA I - zbudowanie wydajnej bazy danych obsługującej wszystkie wskazane (po prawej) zależności, a także przygotowanej na drobne odstępstwa od standaryzowanej treści w przypadku poniektórych nie przewidzianych w fazie projektu źródeł. FAZA II - stworzenie programu obsługującego bazę danych zapewniającego odpowiednią funkcjonalność (niebawem zostanie opisana). Wiem że jeszcze długa droga przede mną, i sporo muszę się nauczyć by osiągnąć cel.
Tu powstaje pytanie. Jak osiągnąć swój lub zbliżony cel? niebawem opiszę jeszcze jakiej funkcjonalności bym wymagał od bazy danych.
BAZA DANYCH - jaki strukturę wybrać? (poniżej zamieszczam omówienie)
Podstawową komórką jest rodzeństwo - powodem takiego wyboru jest podobieństwo genetyczne tychże osób, ponadto rodzeństwo miedzy sobą zwykle ma więcej spójnych cech i faktów ich łączących. I tak do danego rodzeństwa przyporządkowuję następujące dane:
Kolejnym ważnym elementem jest osoba bezpośrednio z danym rodzeństwem jest powiązana konkretna osoba, aczkolwiek niekiedy na podstawie rożnych źródeł otrzymujemy sprzeczne informacje na temat danej osoby, zwykle je uśredniamy i bierzemy pod uwagę część wspólną, zapominając w procesie dalszych badań skąd tak naprawdę co wiemy, a może się okazać że tak naprawdę są to 2 różne osoby. Dlatego pragnę utworzyć klaster zawierający każdą możliwą wersję danej osoby opartą na różnych źródłach. Zarówno klaster osoby, jak i widniejący w nim alternatywne dane na temat osoby zawierać będą losowe ID, pozwalające na każdym etapie badań, złączenie kilku osób w jedną za pomocą zmiany ID klastra, jak i rozdzielenie alternatywnych danych w kilka osób. Dodatkowym przykładem dobrodziejstwa tego procesu jest przykład występowania w bazie kilku rodzin dajmy na to Argasińskich z Lubaczowa i okolic, posiadających odległego wspólnego przodka którego nie znamy, możemy wówczas utworzyć klaster MRCA Argasińskiego, a w nim umieścić jako alternatywne osoby - przodków konkretnych linii. Do klastra alternatywności osoby powiązane są:
Konkretna osoba (z klastra) posiada:
Do każdego z tych parametrów pomijając oczywiście ID można dodać [n] notatek, co zostało pokazane na planszy powyżej. Dodatkowo co również znajduje się na planszy powyżej, a wymaga mojego omówienia to tak zwane „listy: imion, nazwisk etc.” chodzi o to oby nie podawać tych danych w postaci kolejnych ciągów znaków, gdzie nie trudno podczas wprowadzania gdzieś popełnić błąd, tylko utworzyć zbiór imion, nazwisk, etc. (powtarzających się danych) i w zależności od potrzeby odwoływać się w skazanych miejscach do nich.
Relacje Między Osobowe chyba najważniejszy element (warto pamiętać że rodzeństwo, także określa część tych relacji). Relacje dotyczą kilku obszarów: Rodzinne, Genetyczne, i Społeczne; dla każdego z tych rodzajów istnieje dużo typów, ja wyszczególnię tylko kilka z nich, (Uwaga dana relacja posiada zawsze 2 parametry z jednego obszar określające jej typ, jeśli dany typ relacji tego nie wymaga, wartość 1 jest powielona, a także jeśli określamy relację do danego rodzeństwa, lub do klastra osoby, wartość ta zostanie uzupełniona kaskadowo do indywidualnych osób, będących poniżej rodzeństwa, i klastra osobowego): Ojciec-Syn, Matka-Syn, Ojciec-Córka, Matka-Córka, (relacje dotyczące filiacji dodatkowo posiadają opcje do wskazania czy są prawne, biologiczne lub przybrane), Mąż-Żona, Kum, Świadek, Akuszerka, Przyjaciel, Partner, Kochanka, Dziewczyna, Narzeczona, Przyjaciel Rodziny, (jeśli nie jest znane powiązanie rodzinne to: Daleki Krewny, Krewny Genetyczny), itp. Dla każdej relacji są:
Plansza „II” - NOTATKI
Plansza „III” - WYDARZENIA
Fakty i Wydarzenia kolejny dość podstawowy aspekt genealogi, fakty mogą dotyczyć wielu różnych aspektów zostało to uwzględnione na planszach. Podobnie jak z notatką jeden fakt może dotyczyć kilku osób, danych, jak i dla jednej wartości może istnieć kilka faktów. Dla faktów mamy następujące dane:
Plansza „IV” - ŹRÓDŁA
Notatka (żółto-szary ośmiokąt) może się odnosić do niemalże wszystkich danych, i tak jak dla jednego rodzaju danych może być kilka notatek tak jedna notatka może się odwoływać do kilku różnych danych. notatka zawiera następujące parametry:
Źródła są podstawą każdej treści, bowiem każdą informację skądś posiadamy, nawet jeśli jest naszą autorską notką, jeśli baza trafi w inne ręce, informacja taka wymaga opisania.
Repozytorium, zawiera wiele różnych źródeł, dane Źródło zawiera wiele cytatów z jego zawartości wykorzystanych w wielu miejscach, i podobno jak w wydarzenie i notatce, jeden cytat źródłowy może odnosić się do różnych osób, parametrów, jak z i jednym zestawem danych może być powiązanych wiele cytatów źródłowych. Omówienie zacznę od najbardziej zewnętrznego elementu jakim jest Repozytorium lub jak kto woli Archiwum :
Kolejnym elementem są zagnieżdżone w repozytoriach źródła, może to np byś księga metrykalna, lub cmentarz opracowany, lub jakaś inna publikacja, lub osoba fizyczna na którą się powywołujemy. Źródło :
Najgłębiej ukorzeniony jest cytat źródłowy, jest to fragment źródła będący sam w sobie jedną całością, np. jeden wpis z księgi metrykalnej, lub jedna mogiła etc. Cytat Źródłowy :
Plansza „V” - DATA
O każdym fakcie stanowi Data jego wydarzenia i miejsce, żaden problem gdy znamy określoną datę, jednak niekiedy wiemy tylko że coś wydarzyło się przed czymś, lub na podstawie innych faktów obliczamy przedział w którym najprawdopodobniej coś miało miejsce. Istnieje też inna możliwość - jest szereg wydarzeń które mają charakter ciągły trwają od do. Dodatkowo z racji iż zamierzam oznaczać miejsca tam gdzie w danym czasie się znajdowały t.j jeśli dajmy na to moja prababcia urodziła się w 1858 w Bytkowie który wówczas znajdował się w Kries Beuthen, a on w Regierungsbezirk Oppeln, to żeby ten Bytków był znajdywany w każdym okresie w odpowiedniej lokalizacji, potrzebne jest określenie ram czasowych przynależności do danej jednostki terytorialnej. więcej na ten temat przy opisie planszy VI. Wracając do DATY ona posiada 3 elementy datowe w zależności od typu jej aktywne bądź nie: [DATA1], [DATA2], [DATA3]; Dodatkowo każda data pojedyncza może posiadać atrybut: dokładnie w ; około; przed; przed około; po; po około; oszacowana. W przypadku zwykłej daty aktywna jest tylko 2DATA; W przypadku Daty określającej początek czegoś jest aktywna 1DATA (bo jeśli miało coś swój początek musi mieć i swój koniec), podobnie data określająca koniec czegoś aktywna jest w 3 elemencie; Daty w przedziale czasowym posiadają aktywne 1 i 3 element z tym że w 2 pokazywany będzie średnia data z dopiskiem ± i wskazaną wartością, w przedziale to: początek i koniec, pomiędzy x i y, oraz obliczone z zakresie; Dodatkowo istniała by możliwość wskazania daty jako „teraz” co miało by zastosowanie w określaniu czasu od kiedyś do obecności, „teraz” było by aktualizowane automatycznie. Dana data posiadała by następujące parametry:
Plansza „VI” - MIEJSCE - ADRES - KONTAKT
Jak już wspomniałem wszystko ma swoje miejsce i czas, zarówno podstawowy wydarzenia, jak narodziny, ślub, pogrzeb, tak i: adresy zamieszkiwanie, fakty poboczne czyli na podstawie chrztu wiemy że świadek też tego dnia żył - primo, i secundo przebywał tu i ówdzie. jednak jak się pogodzić z faktem ciągłej zmiany granic? podstawowym wyznacznikiem miejsca jest adres GPS, tegoż miejsca i są tu 2 , adres miejscowości i adres konkretnego miejsca - oczywiście nie zawsze wiemy dokładnie także ten drugi, jest opcjonalny. Dana miejscowość posiada rożne ramy czasowe - i w zależności od nich posiada różną przynależność do struktur organizacyjnych np, dajmy na to Lubaczów w pewnym okresie należał do Cyrkułu Żółkiewskiego (Kreis Zolkiewer), w innym czasie do powiatu Cieszanowskiego, w jeszcze innym do Powiatu Lubaczowskiego, a jeszcze wcześniej, bezpośrednio do Woj. Bełzkiego, tak więc, w celu późniejszej automatyzacji za pomocą daty przy wydarzeniu - zagnieżdżenie miejsca w strukturze administracji będzie automatycznie podawało aktualną dla danego okresu przynależność terytorialną, co znacząc może pomóc - przeglądać dane w dalszych wnioskach i poszukiwaniach - a także zapewni autentyczność treści bez potrzeby zmian, dajmy na to mój dziadek urodził się w Galicji, dlaczego mam pisać w MyHeritage że to obecnie Ukraina lub Polska, była Galica!!
To co opisałem znajduje się na zamieszczonym schemacie powyżej, z racji iż ten schemat ogólnie w świetle tego co napisałem jest logiczny, pominę wyszczególnienie jego elementów.
W zależności od potrzeby można użyć Miejscowości/Adresu/Kontaktu; Miejscowość za pomocą ram czasowych jest powiązana z administracją zwierzchnią, miejscowość posiada adres gps, oraz możliwość dołączenie wielu multimediów i notatek.
Adres zakorzeniony jest w miejscowości, a kontakt pod adresem, aczkolwiek nie jest to obowiązkowe, gdyż nowoczesne media, są dostępne z dowolnego miejsca, jednakże jeśli tyczy się to instytucji, zwykle kontakt ma swój adres.
Plansza „VII” - MULTIMEDIA
Ostatnim elementem są Multimedia, czyli wszystko to co dołączamy do naszej dany w wielu rożnych miejscach, mogą to być, skany, dokumenty tekstowe, filmy zdjęcie itp. aczkolwiek jeden dokument może odnosić się do kilku z pośród: osób, wydarzeń, miejscowości, dlatego też nie ma sensu mnożyć elementów powołując je ponownie, lepiej jeden element przyporządkować jak należy kilku sprawą.
Element może być prywatny lub nie, posiada swój identyfikator niepowtarzalny, typ, temat, format adresy url, oraz w przypadku skanów, ważne jest czy dokument posiada 2 stronę, i wtedy te obie strony są sprzężone w jedne element. Oczywiście taki element kiedyś powstał, tak wiec posiada swoją datę, miejsce, może odnosić się do wydarzeń, lub bezpośrednio/osób/rodzin/ źródeł i może posiadać notatki z nim związane, np w przypadku metryk opisaną zawartość jej.
elementy multimediów, można sortować w kolekcje, np księgi metrykalne, herby, jakieś miasto, jakieś wydarzenie etc. taki album może posiadać notatki na swój temat , id, temat, oraz możliwość masowego przyporządkowania daty i miejsca do elementu będącego w zbiorze.