Adatbázis létrehozása
A DB Browserben először létrehoz egy adatbázist (lásd a képzési anyagokat). Az Adatbázis szerkezete lapon válassza a “Táblázat létrehozása” lehetőséget. Először is nevezze el a táblát “Kohorta” névvel. Lejjebb a Mezőknél kattintson a “Mező hozzáadása” gombra. Olyan elnevezési konvenciót fogunk követni, amelyben a mező neve tartalmazza a tábla nevét (ebben a táblában minden mező cohort_-vel fog kezdődni). Ezt azért tesszük, hogy elkerüljük a mezőnevek megkettőződését. Az első mező mindig a rekord egyedi azonosítója lesz. Itt cohort_id-nek nevezzük. A fenti összehasonlító táblázatban láthatja, hogy az SQLite korlátozott számú adattípust tud kezelni. Ebben az esetben a mi választásunk a szöveges kiválasztás a legördülő menüből. “Elsődleges kulcs” és “Not NULL” lesz, ami azt jelenti, hogy egyedi és mindig jelen lesz minden egyes rekordban, amit hozzáadunk. Ezután adjuk hozzá a cohort_cross_date, cohort_parent_1 és cohort_parent_2 mezőket, mindhármat szövegként. Ezután hozzáadunk egy “cohort_location” nevű mezőt szöveges érvényesítéssel. Ez azt jelenti, hogy a mező korlátozott számú lehetőséget fog elfogadni. Ideális esetben az összes szöveges mezőt így tervezzük. Ennek módja a DB Browerben az, hogy beprogramozunk egy ellenőrzést, hogy a bemeneti adat megfelel-e az előzetesen megadott opciók egyikének. Görgessen jobbra, és keresse meg az “Ellenőrzés” oszlopot. Írja be a cohort_location==”tank_1″ VAGY cohort_location==”tank_2″. Lényegében a cohort_location megengedett értékeit fűzi össze a Boolean OR-ral. Vegye figyelembe azt is, hogy dupla egyenlőségjelet kell használnia. A szintaxis ehhez a következő: field_name == “option” OR field_name==”some_other_option”, és az OR-okat folyamatosan hozzáadhatja.
Az egyéni táblát hasonló módon hozzuk létre, de itt bevezetünk egy idegen kulcsot a cohort táblához. Ez azt jelenti, hogy összekötjük a kohorsz táblával, így ebbe a táblába csak a létrehozott kohorszok azonosítóit lehet beírni. Ez tisztán tartja az adatokat, és javítja az esetlegesen a jövőben elvégzendő táblaösszekötések sebességét. Először hozza létre az “individual_id” mezőt TEXT adattípusként és elsődleges kulcsként, Not NULL és Unique. Ezután, amikor létrehozza az “ind_cohort_id” mezőt TEXT adattípusként, görgesse a Foreign Key oszlopra. Amikor a megfelelő mezőre kattint, megjelenik egy legördülő menü. Az első legördülő menüben válassza ki a táblát (ebben az esetben a kohorszot), a következőben pedig a mezőt (“cohort_id”). A txt mezőbe írja be, hogy ON DELETE SET NULL ON UPDATE CASCADE. Választhatja a “NO ACTION” lehetőséget is, ha meg akarja tartani a kohorszra való hivatkozást az egyéni táblában akkor is, ha maga a kohorszrekord törlésre kerül. Nézze meg az alábbi SQL szkript ablakot. Meg kell jelenítenie a FOREIGN KEY(`ind_cohort_id`) REFERENCES `cohort`(`cohort_id`). Ha ez a sor nem jelenik meg, oldja fel és kattintson vissza a PK, U és NN mezőkre. A tábla létrehozásakor az idegen kulcsot is be kell állítania. Ez a DB Browser egyik sajátossága (vagy hibája). Végül fejezze be a “location” TEXT adattípussal.
Végül állítsa be a “fizikai” táblát. Észre fogja venni az új adattípusokat. Először is, a physical_id egy egész szám (INT) és szintén automatikusan inkrementálódik (AI). Ez biztosítja, hogy minden egyes mérés egyedi lesz. Amikor olyan adatokkal dolgozik, amelyek egész számokként érkeznek, mint például a számlálások, győződjön meg róla, hogy az adatokat validálja, hogy azok egész számok legyenek. A “physical_cohort_or_ind” mező azt határozza meg, hogy a mért szervezetet egyedként vagy csak a kohorsz részeként követik-e nyomon (mivel túl kicsi ahhoz, hogy megjelöljék és megkülönböztessék a kohorsz többi tagjától). Ez az adattípus TEXT, ellenőrzéssel (physical_cohort_or_ind==’cohort’ OR physical_cohort_or_ind==’ind’). Végül a súly- és hosszmérések NUMERIC adattípusúak. Megjegyzendő, hogy a mérési egység a mező nevében van kódolva. Külön mezőt is létrehozhat az egységek számára, ha várhatóan különböző műszerekkel és különböző skálákon fog dolgozni. A lényeg, hogy az egységeket a numerikus méréstől elkülönítve tartsa, hogy az adatai rendezettek legyenek, és készen álljanak az átalakításokra és elemzésekre.