Cómo construir una Base de Datos
En el Navegador de Bases de Datos primero creará una base de datos (vea los materiales de entrenamiento). En la pestaña Estructura de la base de datos, seleccione «Crear tabla». En primer lugar, nombre la tabla «Cohorte». Más abajo, en Campos, haga clic en «Añadir campo». Vamos a seguir una convención de nomenclatura en la que el nombre del campo va a contener el nombre de la tabla (todos los campos de esta tabla empezarán por cohort_). Hacemos esto para evitar la duplicación de los nombres de los campos. El primer campo será siempre el identificador único del registro. Aquí lo llamamos cohort_id. Verás en la tabla comparativa anterior que SQLite puede manejar un número limitado de tipos de datos. En este caso nuestra elección es el texto – selecciónelo en el menú desplegable. Va a ser una «clave primaria» y «Not NULL», lo que significa que será única y estará siempre presente en cada registro que se añada. Después de esto añada los campos cohort_cross_date, cohort_parent_1 y cohort_parent_2, los tres como texto. A continuación, añadiremos un campo llamado «cohort_location» con validación para texto. Esto significa que el campo va a aceptar un número limitado de opciones. Idealmente, todos sus campos de texto serán diseñados de esta manera. La forma de hacer esto en DB Brower es programar una comprobación para ver si los datos de entrada son una de las opciones que le has dado de antemano. Desplácese a la derecha y localice la columna «Comprobación». Introduzca cohort_location==»tank_1″ O cohort_location==»tank_2″. Esencialmente estás encadenando los valores permitidos para cohort_location con el booleano OR. Tenga en cuenta también que debe utilizar el doble signo de igualdad. La sintaxis para esto es nombre_de_campo == «opción» O nombre_de_campo== «alguna_otra_opción», y puedes seguir añadiendo OR’s.
La tabla individual se crea de forma similar, pero aquí introduciremos una clave foránea a la tabla de cohortes. Es decir, la vincularemos a la tabla de cohortes, de manera que en esta tabla sólo se podrán introducir los id’s de las cohortes que se hayan creado. Esto mantiene los datos limpios, y mejora la velocidad de cualquier unión de tablas que se decida hacer en el futuro. En primer lugar, cree el campo «individual_id» como un tipo de datos TEXTO y como clave primaria, no nula y única. A continuación, cuando cree «ind_cohort_id» como tipo de dato TEXTO, desplácese a la columna Clave foránea. Cuando haga clic en el campo correspondiente, aparecerá un menú desplegable. En el primer menú desplegable elija la tabla (en este caso, cohorte) y en el siguiente el campo («cohort_id»). En la casilla txt escriba ON DELETE SET NULL ON UPDATE CASCADE. También puede elegir «NO ACTION» si quiere mantener la referencia a la cohorte en la tabla individual aunque se elimine el propio registro de la cohorte. Observe la ventana del script SQL que aparece a continuación. Debería mostrar FOREIGN KEY(`ind_cohort_id`) REFERENCES `cohort`(`cohort_id`). Si esta línea no aparece, desactive y vuelva a hacer clic en los campos PK, U y NN. También tiene que configurar la clave foránea cuando cree la tabla. Esto es una peculiaridad de DB Browser (o un error). Finalmente, termine con «location» como tipo de dato TEXTO.
Por último, configure la tabla «física». Usted notará nuevos tipos de datos. En primer lugar, el physical_id es un entero (INT) y además es autoincremental (AI). Esto garantiza que cada medición que realice será tratada como única. Siempre que trabaje con datos que vienen como números enteros, como los recuentos, asegúrese de validar los datos para garantizar que son enteros. El campo «physical_cohort_or_ind» determina si el organismo medido está siendo rastreado como individuo o sólo como parte de la cohorte (porque es demasiado pequeño para ser etiquetado y distinguido de los otros miembros de la cohorte). Este tipo de datos es TEXT, con Check (physical_cohort_or_ind==’cohort’ OR physical_cohort_or_ind==’ind’). Por último, las medidas de peso y longitud son de tipo de datos NUMERIC. Tenga en cuenta que la unidad de medida está codificada en el nombre del campo. También puede tener un campo separado para las unidades si espera trabajar con diferentes instrumentos y en diferentes escalas. Lo importante es mantener las unidades separadas de la medida numérica, para que sus datos estén ordenados y listos para transformaciones y análisis.