So erstellen Sie eine Datenbank
In DB Browser erstellen Sie zunächst eine Datenbank (siehe Schulungsunterlagen). Wählen Sie auf der Registerkarte „Datenbankstruktur“ die Option „Tabelle erstellen“. Nennen Sie die Tabelle zunächst „Kohorte“. Weiter unten in Felder klicken Sie auf „Feld hinzufügen“. Wir werden einer Namenskonvention folgen, bei der der Feldname den Tabellennamen enthält (alle Felder in dieser Tabelle beginnen mit cohort_). Auf diese Weise wird eine Verdoppelung der Feldnamen vermieden. Das erste Feld wird immer der eindeutige Bezeichner für den Datensatz sein. Hier nennen wir es cohort_id. In der Vergleichstabelle oben sehen Sie, dass SQLite nur eine begrenzte Anzahl von Datentypen verarbeiten kann. In diesem Fall wählen wir einen Text aus dem Dropdown-Menü aus. Es wird ein „Primärschlüssel“ und „Nicht NULL“ sein, was bedeutet, dass er eindeutig ist und in jedem Datensatz, den Sie hinzufügen, immer vorhanden sein wird. Danach fügen Sie die Felder cohort_cross_date, cohort_parent_1 und cohort_parent_2 hinzu, alle drei als Text. Als Nächstes fügen wir ein Feld mit der Bezeichnung „cohort_location“ mit Textüberprüfung hinzu. Das bedeutet, dass das Feld nur eine begrenzte Anzahl von Optionen zulassen wird. Im Idealfall werden alle Ihre Textfelder auf diese Weise gestaltet. In DB Brower können Sie eine Prüfung programmieren, um festzustellen, ob die Eingabedaten einer der Optionen entsprechen, die Sie zuvor festgelegt haben. Blättern Sie nach rechts und suchen Sie die Spalte „Prüfung“. Geben Sie cohort_location==“tank_1″ OR cohort_location==“tank_2″ ein. Im Grunde genommen verknüpfen Sie die zulässigen Werte für cohort_location mit dem booleschen OR. Beachten Sie auch, dass Sie das doppelte Gleichheitszeichen verwenden müssen. Die Syntax hierfür lautet: field_name == „option“ OR field_name==“some_other_option“, und Sie können weitere OR’s hinzufügen.
Die individuelle Tabelle wird auf ähnliche Weise erstellt, aber hier werden wir einen Fremdschlüssel zur Kohortentabelle einführen. Das bedeutet, dass wir sie mit der Kohortentabelle verknüpfen, so dass nur die IDs von Kohorten, die erstellt wurden, in diese Tabelle eingegeben werden können. Auf diese Weise bleiben die Daten sauber, und die Geschwindigkeit von Tabellenverknüpfungen, die Sie in Zukunft vornehmen möchten, wird erhöht. Erstellen Sie zunächst das Feld „individual_id“ als TEXT-Datentyp und als Primärschlüssel, Not NULL und Unique. Wenn Sie dann „ind_cohort_id“ als TEXT-Datentyp erstellen, blättern Sie zur Spalte Fremdschlüssel. Wenn Sie auf das entsprechende Feld klicken, wird ein Dropdown-Menü angezeigt. Wählen Sie im ersten Dropdown-Menü die Tabelle (in diesem Fall die Kohorte) und im nächsten das Feld („cohort_id“). In das Feld txt geben Sie ON DELETE SET NULL ON UPDATE CASCADE ein. Sie können auch „NO ACTION“ wählen, wenn Sie den Verweis auf die Kohorte in der individuellen Tabelle behalten wollen, auch wenn der Kohortendatensatz selbst gelöscht wird. Beobachten Sie das SQL-Skriptfenster unten. Es sollte FOREIGN KEY(`ind_cohort_id`) REFERENCES `cohort`(`cohort_id`) anzeigen. Wenn diese Zeile nicht erscheint, klicken Sie die Felder PK, U und NN ab und wieder an. Sie müssen auch den Fremdschlüssel einrichten, wenn Sie die Tabelle erstellen. Dies ist eine Eigenart von DB Browser (oder ein Fehler). Abschließend geben Sie „location“ als TEXT-Datentyp ein.
Schließlich richten Sie die „physische“ Tabelle ein. Sie werden neue Datentypen bemerken. Zunächst einmal ist die „physical_id“ eine ganze Zahl (INT) und wird automatisch inkrementiert (AI). Dadurch wird sichergestellt, dass jede Messung, die Sie vornehmen, als eindeutig behandelt wird. Wann immer Sie mit Daten arbeiten, die als ganze Zahlen vorliegen, wie z. B. Zählungen, sollten Sie sicherstellen, dass es sich um ganze Zahlen handelt. Das Feld „physical_cohort_or_ind“ gibt an, ob der gemessene Organismus als Individuum oder nur als Teil der Kohorte verfolgt wird (weil er zu klein ist, um markiert und von den anderen Mitgliedern der Kohorte unterschieden zu werden). Dieser Datentyp ist TEXT, mit Check (physical_cohort_or_ind==’cohort‘ OR physical_cohort_or_ind==’ind‘). Die Messungen von Gewicht und Länge schließlich sind vom Datentyp NUMERIC. Beachten Sie, dass die Maßeinheit im Feldnamen kodiert ist. Sie können auch ein separates Feld für die Einheiten haben, wenn Sie mit verschiedenen Instrumenten und in verschiedenen Maßstäben arbeiten wollen. Wichtig ist, dass Sie die Einheiten von den numerischen Messwerten getrennt halten, damit Ihre Daten ordentlich und bereit für Transformationen und Analysen sind.