From 94e0ff4d3ce7dc832ebfdac38cdf3a361a757646 Mon Sep 17 00:00:00 2001 From: Andree Valle Campos Date: Tue, 22 Oct 2024 19:27:02 +0100 Subject: [PATCH] arreglar headings para ver agenda y puntos clave --- episodes/Banco_errores.Rmd | 12 ++--- episodes/Reporte.Rmd | 42 +++++++++--------- episodes/Taller-R-RStudio.Rmd | 19 ++++---- episodes/Visualizacion.Rmd | 44 +++++++++--------- episodes/limpieza.Rmd | 84 +++++++++++++++++------------------ 5 files changed, 100 insertions(+), 101 deletions(-) diff --git a/episodes/Banco_errores.Rmd b/episodes/Banco_errores.Rmd index fa98259..024b5b4 100644 --- a/episodes/Banco_errores.Rmd +++ b/episodes/Banco_errores.Rmd @@ -19,15 +19,15 @@ exercises: 8 --- ::: questions -### Pregunta introductoria -- ¿Tiene algunas dificultades con el código en R? +- ¿Tiene algunas dificultades con el código en R? + ::: ::: objectives -# Objetivo -En este documento usted podrá encontrar algunas de las preguntas y errores frecuentes de la ejecución del código en R. +- En este documento usted podrá encontrar algunas de las preguntas y errores frecuentes de la ejecución del código en R. + ::: ```{r setup, include=FALSE} @@ -365,12 +365,12 @@ datos %>% group_by(pais) %>% ::: keypoints -## Puntos clave Si después de buscar en esta guía sus preguntas no encontro respuesta por favor diligencie el siguiente formulario [Dudas por resolver](https://forms.office.com/pages/responsepage.aspx?id=Dpn32j-KnECbdipUdQmAAMjWJqHZ8P1DkQQdb07M30RUOEY5N1U1UDFYMExGMzFHRkRKT1BTRTFRWS4u&route=shorturl&sid=6a94f23c-049c-4f54-9732-fc25789059b3){.uri} + ::: -## Contribuciones +### Contribuciones - José M. Velasco-España: Versión inicial diff --git a/episodes/Reporte.Rmd b/episodes/Reporte.Rmd index 4d0ca5c..6f10680 100644 --- a/episodes/Reporte.Rmd +++ b/episodes/Reporte.Rmd @@ -17,18 +17,18 @@ editor_options: --- ::: questions -## Pregunta introductoria -- ¿Cómo se utilizan R markdown para presentar un reporte? +- ¿Cómo se utilizan R markdown para presentar un reporte? + ::: ::: objectives -## Objetivos Al final de este taller usted podrá: -- Reconocer la importancia de generar informes en R Markdown\ -- Aprender a utilizar R markdown de forma básica +- Reconocer la importancia de generar informes en R Markdown\ +- Aprender a utilizar R markdown de forma básica + ::: ::: prereq @@ -53,7 +53,7 @@ opts_chunk$set(collapse = TRUE) ::: -# Introducción +## Introducción En esta unidad aprenderemos sobre el uso del formato R Markdown, el cual permite integrar código en la generación de informes sin la necesidad de @@ -62,7 +62,7 @@ R Markdown facilita la generación automática, actualización y redacción de informes técnicos al combinar la sintaxis del formato Markdown con código en R incrustado en el documento. -# **Tema 1: ¿Qué es R Markdown?** +## **Tema 1: ¿Qué es R Markdown?** R Markdown es una extensión del formato Markdown que permite combinar texto con código R incrustado en el documento. De esta manera, los @@ -75,7 +75,7 @@ resultados de manera clara y reproducible. Además, es una herramienta muy valiosa para generar informes automatizados y documentos técnicos interactivos -# **Tema 2: Estructura de R Markdown** +## **Tema 2: Estructura de R Markdown** Un documento de R Markdown consta de tres tipos principales de elementos: @@ -90,17 +90,17 @@ sus resultados. ![](fig/partes_reporte.png) -# **Tema 3: Paso a Paso en R Markdown** +## **Tema 3: Paso a Paso en R Markdown** A continuación, seguiremos un paso a paso para crear un R Markdown. -## **Paso 1.** Abrir R Studio desde R Project +### **Paso 1.** Abrir R Studio desde R Project De acuerdo a lo aprendido en la unidad de Introducción a R y Rstudio, es recomendable tener un R project donde quedará alojado el informe de R Markdown. Abre un R Project y sigue con el Paso 2. -## **Paso 2. Crear un nuevo archivo R Markdown** +### **Paso 2. Crear un nuevo archivo R Markdown** Siguiendo la ruta **File**\>**New File**\>**R Markdown** podemos crear un archivo de R Markdown definiendo: título, autor(es) y con formato de @@ -111,7 +111,7 @@ R Markdown con tu nombre y el título de Reporte. ![](fig/crea_reporte.png) -## **Paso 3. Editar el archivo de R Markdown y el código** +### **Paso 3. Editar el archivo de R Markdown y el código** ::: callout Es importante recordar que R Markdown tiene tres secciones, todas @@ -125,7 +125,7 @@ las diferentes secciones que se muestran en la imagen. A continuación, veremos cómo editar cada una de estas partes: -### **¿Cómo editar el texto?** +#### **¿Cómo editar el texto?** - Para incluir el título de una sección se escribe el símbolo numeral \# y a continuación el nombre de la sección en una línea única. @@ -145,7 +145,7 @@ A continuación, veremos cómo editar cada una de estas partes: - Para situar el texto en un bloque aparte, se antecede este texto con el símbolo \> en una línea única. -### **¿Cómo editar el *chunk* de código?** +#### **¿Cómo editar el *chunk* de código?** Para incluir código en R, es necesario introducir un *chunk* en el documento marcando en la barra de herramientas el icono +C de color @@ -182,7 +182,7 @@ parte superior derecha de cada Chunk. ![](fig/run_actual.png) -### **Especificar configuración del *chunk*** +#### **Especificar configuración del *chunk*** Dentro de un "chunk", podemos elegir si queremos que el código se muestre en el reporte impreso o no; utilizando los comandos @@ -201,7 +201,7 @@ código, como se muestra aquí. ```` ``` ```` -### **Hacer tablas en R Markdown** +#### **Hacer tablas en R Markdown** ::: callout La tabla de datos para esta práctica será la misma de la Unidad de @@ -241,7 +241,7 @@ covid_paises <- dat %>% kable(covid_paises) ``` -### **Poner parámetros automatizados en el texto** +#### **Poner parámetros automatizados en el texto** En un reporte también es posible combinar código y texto, utilizando los resultados obtenidos en el código como parte del texto del reporte. Es @@ -281,7 +281,7 @@ Para ver cómo queda combinado el resultado del código con este texto debemos seguir el siguiente paso. ::: -## **Paso 4. "Tejer" (generar) el informe** +### **Paso 4. "Tejer" (generar) el informe** Para "tejer" el informe, es decir, generar el informe en un formato específico (HTML, PDF o Word), debemos dar click en el símbolo *"Knit"* @@ -301,15 +301,15 @@ femenino. ¡Felicitaciones, ha producido su primer reporte R Markdown en html! ::: keypoints -## Puntos clave Revise si al final de esta lección adquirió estas competencias: - Reconocer la importancia de generar informes en R Markdown\ - Aprender a utilizar R markdown de forma básica + ::: -## Contribuciones +### Contribuciones - Zulma M. Cucunuba: Versión inicial - Laura Gómez-Bermeo: Edición @@ -317,6 +317,6 @@ Revise si al final de esta lección adquirió estas competencias: - Andree Valle: Ediciones menores - José M. Velasco España: Ediciones menores -## Asuntos legales +### Asuntos legales **Copyright**: Zulma M. Cucunuba, 2019 diff --git a/episodes/Taller-R-RStudio.Rmd b/episodes/Taller-R-RStudio.Rmd index 16bbea2..91f9e95 100644 --- a/episodes/Taller-R-RStudio.Rmd +++ b/episodes/Taller-R-RStudio.Rmd @@ -26,24 +26,23 @@ editor_options: --- ::: questions -### Pregunta introductoria -- ¿Cómo se utilizan R y RStudio en el análisis de datos y la salud - pública? +- ¿Cómo se utilizan R y RStudio en el análisis de datos y la salud pública? + ::: ::: objectives -### Objetivos Al final de este taller usted podrá: -- Reconocer y hacer uso de R y RStudio. -- Conocer los tipos de datos y operados básicos en R. -- Comprender las estructuras básicas de datos en R tales como vectores +- Reconocer y hacer uso de R y RStudio. +- Conocer los tipos de datos y operados básicos en R. +- Comprender las estructuras básicas de datos en R tales como vectores y tablas de datos. -- Comprender el proceso de creación de funciones. -- Reconocer el proceso de importación, exportación y transformación de +- Comprender el proceso de creación de funciones. +- Reconocer el proceso de importación, exportación y transformación de bases de datos con Tidyverse. + ::: ::: prereq @@ -856,7 +855,6 @@ Después de cargar los datos debe realizar lo siguiente: ::: ::: keypoints -## Puntos clave Revise si al final de esta lección adquirió estas competencias: @@ -867,6 +865,7 @@ Revise si al final de esta lección adquirió estas competencias: - Comprender el proceso de creación de funciones. - Reconocer el proceso de importación, exportación y transformación de bases de datos con Tidyverse. + ::: ### Contribuciones diff --git a/episodes/Visualizacion.Rmd b/episodes/Visualizacion.Rmd index 81be1c7..cb45da7 100644 --- a/episodes/Visualizacion.Rmd +++ b/episodes/Visualizacion.Rmd @@ -18,18 +18,18 @@ editor_options: --- ::: questions -### Pregunta introductoria -- ¿Cómo visualizar datos epidemiologicos con ggplot2? +- ¿Cómo visualizar datos epidemiologicos con ggplot2? + ::: ::: objectives -# Objetivos Al final de este taller usted podrá: -- Reconocer las funciones que componen el paquete ggplot2. -- Realizar gráficos básicos con la estructura de ggplot2 +- Reconocer las funciones que componen el paquete ggplot2. +- Realizar gráficos básicos con la estructura de ggplot2 + ::: ::: prereq @@ -62,7 +62,7 @@ opts_chunk$set(collapse = TRUE) **Desarrollo del contenido** (desarrolle cada uno de los temas teniendo en cuenta la tabla de contenido) -# Introducción +## Introducción En el ámbito de la ciencia de datos y la toma de decisiones, la habilidad para transformar datos en información comprensible y que @@ -72,7 +72,7 @@ En esta unidad haremos uso de ggplot2, una poderosa librería de gráficos de R basada en la gramática de gráficos, para crear visualizaciones impactantes. -# Tema 1: Principios de la gramática de gráficos con `ggplot2` +## Tema 1: Principios de la gramática de gráficos con `ggplot2` `ggplot2` es un paquete de R basado en la gramática de gráficos que permite visualizar datos de una manera consistente y estructurada. @@ -90,7 +90,7 @@ descompone un gráfico en sus componentes fundamentales y define cómo se combinan estos componentes para representar datos. ::: checklist -## Estos componentes básicos son: +### Estos componentes básicos son: **1. Datos (Data):** representan los datos que queremos visualizar. Puede ser una tabla de datos (data.frame) en R u otra fuente de datos. @@ -135,7 +135,7 @@ ggplot(data, \# Los datos ``` ::: -# Tema 2: Ejemplos del uso de la gramática de gráficos con ggplot +## Tema 2: Ejemplos del uso de la gramática de gráficos con ggplot Aquí vamos a ir explicando cómo puedes hacer uso de esta herramienta en tu computador. A medida que avanzas trata de ir replicando los @@ -195,7 +195,7 @@ verifica la estructura de la tabla de datos glimpse(covid19) ``` -## Estética (Aesthetics) +### Estética (Aesthetics) En el contexto de la gramática de gráficos, la estética (aesthetics) se refiere a cómo mapeamos los atributos de nuestros datos a propiedades @@ -253,7 +253,7 @@ ggplot(data = covid19_resumen, geom_point() ``` -## Geometría (Geometry): +### Geometría (Geometry) La geometría representa la forma en que los datos se visualizan en el gráfico; como puntos, líneas, barras, áreas, etc. Cada tipo de gráfico @@ -386,7 +386,7 @@ ggplot(covid19_ubicacion, Pregunta ¿cómo produciría esta misma gráfica, pero en orden ascendente? ::: -## **Escala:** +### Escala En la gramática de gráficos en `ggplot2`, la escala se refiere a la forma en que los valores de los datos se traducen en propiedades @@ -397,7 +397,7 @@ A continuación, veremos algunos de los diferentes tipos de escalas disponibles en `ggplot2` y sus funciones: ::: checklist -### 1. Para **datos de tipo continuo o numéricos** tenemos **escalas continuas como:** +#### 1. Para **datos de tipo continuo o numéricos** tenemos **escalas continuas como:** - `scale_x_continuous()` y `scale_y_continuous()` : para el eje x y el eje y, respectivamente. @@ -408,7 +408,7 @@ disponibles en `ggplot2` y sus funciones: ::: ::: checklist -### 2. Para **datos categóricos o de carácter** tenemos escalas discretas como: +#### 2. Para **datos categóricos o de carácter** tenemos escalas discretas como: - `scale_x_discrete()` y `scale_y_discrete()`: para el eje x y el eje y, respectivamente. @@ -420,14 +420,14 @@ disponibles en `ggplot2` y sus funciones: ::: ::: checklist -### 3. Para **datos de fecha** tenemos escalas de fechas como: +#### 3. Para **datos de fecha** tenemos escalas de fechas como: - `scale_x_date()` y `scale_y_date()`: para el eje x y el eje y, respectivamente cuando se tengan datos de fecha. ::: ::: checklist -### 4. Para hacer uso de escalas personalizadas se hace uso de escalas manuales en las que podemos especificar nuestros propios valores. +#### 4. Para hacer uso de escalas personalizadas se hace uso de escalas manuales en las que podemos especificar nuestros propios valores. - `scale_color_manual()`: se especifica manualmente los colores para los valores. @@ -437,7 +437,7 @@ disponibles en `ggplot2` y sus funciones: ::: ::: checklist -### 5. Otras escalas: +#### 5. Otras escalas: - `scale_fill_*`: se usa similar a las escalas de color pero para colores que queramos con relleno. @@ -483,7 +483,7 @@ ggplot(covid19_ubicacion, ¿Qué diferencias ve con la última gráfica del Ejemplo 4.? ::: -## Facetas +### Facetas Las Facetas (`Facets`) en la gramática de gráficos son una forma de dividir los datos en subconjuntos y representarlos en múltiples paneles @@ -544,7 +544,7 @@ ggplot(covid19_sexo, aes(edad, casos)) + facet_wrap(~sexo) ``` -## Tema +### Tema En la gramática de gráficos, el tema se refiere a la personalización de la apariencia visual general del gráfico; como los títulos, etiquetas de @@ -613,15 +613,15 @@ ggplot(data = covid19_sexo, ``` ::: keypoints -## Puntos clave Revise si al final de esta lección adquirió estas competencias: - Reconocer las funciones que componen el paquete ggplot2. - Realizar gráficos básicos con la estructura de ggplot2. + ::: -## Contribuciones +### Contribuciones - Zulma M. Cucunuba: Versión inicial - Geraldine Gomez: Edición @@ -629,6 +629,6 @@ Revise si al final de esta lección adquirió estas competencias: - Laura Gómez-Bermeo: Ediciones menores - José M. Velasco-España: Ediciones menores -## Asuntos legales +### Asuntos legales **Copyright**: Zulma M. Cucunuba, 2023 diff --git a/episodes/limpieza.Rmd b/episodes/limpieza.Rmd index 1271d52..7e213de 100644 --- a/episodes/limpieza.Rmd +++ b/episodes/limpieza.Rmd @@ -17,23 +17,22 @@ editor_options: --- ::: questions -## Pregunta introductoria -- ¿Cómo limpiar datos epidemiológicos con R? +- ¿Cómo limpiar datos epidemiológicos con R? + ::: ::: objectives -## Objetivos Al final de este taller usted podrá: -- Reconocer las herramientas que facilitan la limpieza de datos +- Reconocer las herramientas que facilitan la limpieza de datos epidemiológicos. -- Identificar las buenas prácticas de la limpieza de datos +- Identificar las buenas prácticas de la limpieza de datos epidemiológicos. -- Explorar el proceso de limpieza, organización y caracterización de +- Explorar el proceso de limpieza, organización y caracterización de datos epidemiológicos. ::: @@ -49,7 +48,8 @@ opts_chunk$set(collapse = TRUE) ``` ::: checklist -## **Tabla de contenido** + +### **Tabla de contenido** - Módulo: Ciencia de datos en salud pública - Unidad: Limpieza de datos epidemiológicos @@ -62,7 +62,7 @@ opts_chunk$set(collapse = TRUE) ::: -# Introducción +## Introducción En esta unidad abordaremos el proceso de limpieza de datos epidemiológicos, utilizando los conocimientos previos de la unidad de la @@ -77,17 +77,17 @@ análisis y comprenderá cómo describir y organizar los datos, clasificar variables, aplicar formatos a las variables, manejar datos duplicados y abordar la ausencia de datos. -# **Tema 2: Exploración y caracterización de los datos** +## **Tema 2: Exploración y caracterización de los datos** -## **2.2. Exploración de la estructura de los datos en R** +### **2.2. Exploración de la estructura de los datos en R** Una vez hecha la exploración y la caracterización de los datos mediante la documentación se procederá a explorar el dataset. -### **2.2.1. Carga de la información** +#### **2.2.1. Carga de la información** ::: checklist -## ⚠️ **Instrucciones:** +### ⚠️ **Instrucciones:** Antes de empezar a trabajar verifique que ya cuenta con los siguientes pasos: @@ -159,7 +159,7 @@ covid <- rio::import("data/covid_LA.csv") Ahora que la base está cargada podemos hacer la revisión del formato de los datos. -### **2.2.2. Exploración del dataset** +#### **2.2.2. Exploración del dataset** En este ejercicio para explorar las variables contenidas en el objeto covid se puede realizar una aproximación general o específica a cada @@ -185,7 +185,7 @@ covid %>% dplyr::glimpse() ``` -### **2.2.3. Aplicación de buenas prácticas para nombrar variables** +#### **2.2.3. Aplicación de buenas prácticas para nombrar variables** ::: callout **Tip de buena práctica:** De acuerdo con las buenas prácticas de @@ -246,7 +246,7 @@ covid %>% dplyr::glimpse() ``` -### **2.2.4. Resumen de variables** +#### **2.2.4. Resumen de variables** Para empezar la exploración de las variables, emplearemos la función summary. @@ -295,7 +295,7 @@ covid %>% base::summary() ``` -### **2.2.5. Exploración de variables cuantitativas** +#### **2.2.5. Exploración de variables cuantitativas** Otra forma de explorar variables cuantitativas es en forma de gráfica. Empleando gráficos como histogramas, diagrama de cajas y bigotes, líneas @@ -347,7 +347,7 @@ Para explorar más temas de visualización por favor diríjase a la **Unidad. Introducción a la visualización de datos en R con ggplot2**. ::: -### **2.2.6. Exploración de variables cualitativas** +#### **2.2.6. Exploración de variables cualitativas** Ahondemos un poco más en la exploración de variables cualitativas. Cuando usamos `summary`, al inicio de esta sección, pudimos ver que @@ -474,9 +474,9 @@ covid %>% graphics::barplot() ``` -# **Tema 3: Modificación, limpieza y corrección de los datos: Errores frecuentes y sus soluciones** +## **Tema 3: Modificación, limpieza y corrección de los datos: Errores frecuentes y sus soluciones** -## **3.1. Revisión de la coherencia del contenido de las variables.** +### **3.1. Revisión de la coherencia del contenido de las variables.** Para emplear estas funciones de conversión podemos emplearlas directamente a cada variable (ej. `as.factor(covid$sexo)`) o hacer uso @@ -650,7 +650,7 @@ covid <- covid %>% lang = "es") ``` -## **3.2. Identificación de valores erróneos o faltantes.** +### **3.2. Identificación de valores erróneos o faltantes.** Además de los valores NA en nuestro procesamiento de datos podemos encontrar otros valores Inf (valores infinitos) o NaN (valores numéricos @@ -659,9 +659,9 @@ indeterminados). La identificación de datos faltantes requiere en primera instancia identificar la causa de la ausencia de estos datos. -### **3.2.1. Valores NA** +#### **3.2.1. Valores NA** -#### **NAs relacionados con separadores incorrectos** +##### **NAs relacionados con separadores incorrectos** Veamos un ejemplo común de aparición de `NA`: cuando tenemos diferentes separadores para números (ej. en talla). @@ -774,7 +774,7 @@ covid %>% Como podemos ver, una vez hecha la transformación ya no aparecen comillas "", indicando que ya se hizo la conversión a numéricos. -#### **NAs relacionados con errores en la escritura de fechas** +##### **NAs relacionados con errores en la escritura de fechas** En algunas ocasiones puede ocurrir que la escritura de fechas sigue el criterio de quién recolecta los datos. Por ejemplo, en un formulario que @@ -844,7 +844,7 @@ covid <- covid %>% target_columns = "fecha_reporte_web") ``` -#### **NAs relacionados con errores en la escritura de números** +##### **NAs relacionados con errores en la escritura de números** En algunos casos pueden ocurrir errores en la recolección que no se corrigen en la digitación como, por ejemplo, escribir el nombre de un @@ -903,7 +903,7 @@ Como puede observar los números en letras fueron convertidos a sus respectivos equivalentes numéricos. Mientras que todo elemento no reconocido como número fue convertido en `NA`. -#### **NAs relacionados con dos datos en la misma columna** +##### **NAs relacionados con dos datos en la misma columna** En algunos casos un dataset puede contener dos variables en una misma columna. @@ -968,7 +968,7 @@ trabajadas y el analista de datos debe usar su criterio en cada circunstancia y hacer pruebas que le permitan revisar si los resultados son los esperados. -### **3.2.2. Valores infinitos (`Inf`)** +#### **3.2.2. Valores infinitos (`Inf`)** Los valores infinitos pueden generarse cuando una operación resulta en un número demasiado grande (Inf+) o demasiado pequeño (Inf -) para R. En @@ -1012,7 +1012,7 @@ covid %>% utils::head() ``` -### **3.2.3. Valores indeterminados (`NaN`)** +#### **3.2.3. Valores indeterminados (`NaN`)** Estos valores se generan cuando se realizan operaciones matemáticamente indefinidas. Por ejemplo, si intentamos dividir cero entre cero o restar @@ -1039,7 +1039,7 @@ estos pueden aparecer cuando en el proceso de conversión de variables cometemos un error o al crear una variable tras una operación errónea y el error se propaga en operaciones subsecuentes. -### **3.2.4. Datos duplicados** +#### **3.2.4. Datos duplicados** Otro error que puede ocurrir frecuentemente son los datos duplicados. Estos pueden ser tanto una observación de una variable duplicada o todo @@ -1134,7 +1134,7 @@ querer remover esas filas, de lo contrario puede ejecutar la función sin sobrescribir el objeto para observar los resultados y cuando se este seguro almacenarlo. -### **3.2.5. Errores tipográficos** +#### **3.2.5. Errores tipográficos** A veces, podemos encontrar que las categorías de una variable se han escrito de múltiples maneras. Veamos un ejemplo: @@ -1165,7 +1165,7 @@ covid %>% base::table(useNA = "always") ``` -### **3.2.6. Reemplazar valores perdidos** +#### **3.2.6. Reemplazar valores perdidos** En algunas ocasiones los dataset contienen valores que no corresponden a las categorías de las variables, faltan o desde la documentación sabemos @@ -1213,7 +1213,7 @@ covid %>% base::table(useNA = "always") ``` -### **3.2.7. Columnas con valores constantes** +#### **3.2.7. Columnas con valores constantes** En algunas ocasiones, es posible encontrar columnas que contienen un único valor. Esto puede ocurrir, por ejemplo, cuando se divide un @@ -1244,7 +1244,7 @@ covid %>% base::ncol() ``` -### **3.2.8. Verificación de valores atípicos** +#### **3.2.8. Verificación de valores atípicos** Para evaluar si los datos se encuentran dentro de un rango esperado o si existen valores atípicos, se puede emplear la creación de gráficas o la @@ -1329,7 +1329,7 @@ corregir este tipo de errores se puede eliminar las filas que contienen estos datos o reasignar a estos valores con datos tipo NA para no perder la demás información. -### **3.2.9. Corrección de errores en fechas** +#### **3.2.9. Corrección de errores en fechas** Una vez explorados los datos e identificados posibles errores, podemos explorar las medidas correctivas a utilizar. En este caso teniendo en @@ -1383,7 +1383,7 @@ covid %>% **Resultado esperado:** Al usar el anterior código con el mismo dataset se obtiene el siguiente resultado: -### **3.2.10. Filtrado de registros con NA** +#### **3.2.10. Filtrado de registros con NA** En ciertos análisis, puede ser necesario excluir los valores NA. Para lograr esto, podemos utilizar la función de filtrado proporcionada por @@ -1417,7 +1417,7 @@ covid %>% Como puede observar ahora los NA son 0. -### **3.2.11. Reemplazo de siglas, abreviaturas o valores códigos** +#### **3.2.11. Reemplazo de siglas, abreviaturas o valores códigos** En el proceso de la recopilación o entrada de datos, es común el uso de siglas, abreviaturas o códigos para registrar información. Por ejemplo, @@ -1476,12 +1476,12 @@ covid %>% base::table(useNA = "always") ``` -# **Tema 4: Organización de los datos** +## **Tema 4: Organización de los datos** Finalmente podemos realizar algunas actividades de organización de datos. Como, por ejemplo: -## 4.1. Eliminación de variables repetidas o que no tengan utilidad en responder la pregunta de investigación +### 4.1. Eliminación de variables repetidas o que no tengan utilidad en responder la pregunta de investigación Durante la exploración de datos es posible encontrar variables cuyo contenido no es necesario para el análisis o que ya no se requieren. @@ -1497,7 +1497,7 @@ covid <- covid %>% dplyr::select (!edad_repetida) ``` -## 4.2. Organización de las variables +### 4.2. Organización de las variables Parte de la organización de las variables incluye asignar nombres apropiados a las variables, según la necesidad del proyecto. Esto se @@ -1514,7 +1514,7 @@ covid <- covid %>% ¿A qué otras columnas les cambiaría el nombre? -## 4.3. Almacenamiento del dataset limpio +### 4.3. Almacenamiento del dataset limpio Una vez se haya terminado la modificación, limpieza y corrección de los datos podemos guardar el dataset limpio. Esto se debe a que, todos los @@ -1548,7 +1548,6 @@ embargo, se recomienda RDS por su bajo peso y capacidad de almacenamiento. ::: keypoints -## Puntos clave Revise si al final de esta lección adquirió estas competencias: @@ -1560,9 +1559,10 @@ Revise si al final de esta lección adquirió estas competencias: - Explorar el proceso de limpieza, organización y caracterización de datos epidemiológicos. + ::: -## Contribuciones +### Contribuciones - Zulma M. Cucunuba: Versión inicial - Laura Gómez-Bermeo: Edición @@ -1570,6 +1570,6 @@ Revise si al final de esta lección adquirió estas competencias: - Andree Valle: Ediciones menores - José M. Velasco España: Ediciones menores -## Asuntos legales +### Asuntos legales **Copyright**: Zulma M. Cucunuba, 2019