Matemáticas para la Estadística Médica con R

Bioestadística — Universidad de Granada

Material docence de Matemáticas para la Estadística Médica con R (Bioestadística) desarrollados por el autor en el Departamento de Estadística e Investigación Operativa, Unidad Docente de Bioestadística de la Universidad de Granada.

Autor/a
Afiliación

Dpto. de Estadística e Investigación Operativa, Universidad de Granada

Fecha de publicación

2026

Prefacio

Este libro contiene el material docente del curso Matemáticas para la Estadística Médica con R desarrollado por Miguel Ángel Luque Fernández en el Departamento de Estadística e Investigación Operativa de la Universidad de Granada.

Objetivos del Curso

El objetivo principal de este curso y material docente es proporcionar al estudiante de ciencias de la salud los fundamentos matemáticos y estadísticos necesarios para el análisis cuantitativo de datos médicos con un alto grado de rigor académico y con ejemplos contextualizados en la práctica clínica. El libro se sustenta de la filosofía de ciencia reproducible, abierta y computacionalmente aplicada usando el software libre R. Al final del libro se presentan cuatro apéndices reforzando a los alumnos que quieran repasar sobre: i) los contenidos matemáticos básicos necesarios para el buen aprovechamiento del curso, ii) una introducción básica a la programación con R, iii) una introducción al paquete BioEstatR producido para la docencia específica de este curso cuyo interés radica en la rica interpretación de los resultados de las funciones del paquete y iv) una introducción a la investigación reproducible mediante el control de versiones con Git, GitHub y RStudio. El curso no se limita al uso del paquete BioEstatR, ya que se complementa con el uso de las funciones clásicas de R base para todos los ejemplos presentados. Además, se invita al estudiante a explorar y utilizar JAMOVI, una plataforma de estadística gratuita y de código abierto diseñada para ser fácil de usar. Al finalizar el curso, el estudiante será capaz de:

  1. Describir y visualizar conjuntos de datos mediante técnicas de Análisis Exploratorio de Datos.
  2. Comprender los fundamentos de la teoría de la probabilidad como base del razonamiento estadístico.
  3. Manejar las distribuciones de probabilidad más importantes, tanto discretas como continuas.
  4. Aplicar métodos de inferencia estadística: estimación puntual, estimación por intervalos y contraste de hipótesis.
  5. Construir e interpretar modelos de regresión lineal simple y múltiple.

Estructura del Libro

El material está organizado en cuatro partes, correspondientes a las diez semanas lectivas del curso:

Parte I — Análisis Exploratorio de Datos (Semanas 1–2) Introducción a los tipos de variables, estadísticos descriptivos univariantes y bivariantes, medidas de dispersión, correlación y representaciones gráficas básicas.

Parte II — Probabilidad y Variables Aleatorias (Semanas 3–5) Fundamentos de la teoría de la probabilidad: espacio muestral, axiomas de Kolmogórov, probabilidad condicional y teorema de Bayes. Variables aleatorias discretas y continuas, distribuciones de probabilidad más importantes y el teorema del límite central.

Parte III — Inferencia Estadística (Semanas 7–9) Conceptos de muestreo y estadísticos muestrales. Estimación puntual: propiedades de los estimadores, método de momentos y máxima verosimilitud. Estimación por intervalos de confianza. Contrastes de hipótesis: errores de tipo I y II, potencia del contraste, pruebas t, z y F.

Parte IV — Regresión Lineal (Semanas 10–11) Regresión lineal simple: mínimos cuadrados ordinarios, interpretación de coeficientes, \(R^2\) y análisis de residuos. Regresión lineal múltiple: formulación matricial, selección de variables y ANOVA de regresión.

Parte V — Métodos Avanzados en Bioestadística Para profundizar en técnicas estadísticas avanzadas aplicadas a la medicina, se recomienda consultar el recurso complementario: Bioestadística Avanzada.

Este material avanzado cubre temas críticos para la investigación médica moderna, incluyendo: - Pruebas Diagnósticas: Evaluación de precisión, sensibilidad, especificidad y curvas ROC. - Regresión Logística: Modelado de variables dependientes binarias y cálculo de Odds Ratios. - Análisis de Supervivencia: Estimadores de Kaplan-Meier y modelos de riesgos proporcionales de Cox para datos de tiempo a evento. - Inferencia Causal y Métodos Robustos: Técnicas avanzadas para el control de la confusión y el análisis de datos longitudinale (en preparación).

Sobre el Autor

Miguel Ángel Luque Fernández es Catedrático del Departamento de Estadística e Investigación Operativa de la Universidad de Granada. Sus líneas de investigación se centran en la epidemiología cuantitativa, la bioestadística y la inferencia causal.

Software y Reproducibilidad

Todos los ejemplos de código en este libro están escritos en R. Para reproducir los análisis se recomienda instalar R (versión ≥ 4.3) y los siguientes paquetes:

Mostrar el código
install.packages(c("ggplot2", "dplyr", "tidyr", "knitr", "kableExtra", "MASS"))

Además, para facilitar el aprendizaje y la aplicación práctica, contamos con:

  • BioEstatR: Paquete de R desarrollado en la Unidad de Bioestadística de la Facultad de Medicina de la Universidad de Granada por Pedro Femia Marzo y Miguel Ángel Luque Fernández. Proporciona funciones de alto nivel que integran descripción, inferencia, modelización (lineal y logística) y visualización en una sola llamada, diseñadas específicamente para la docencia de bioestadística en ciencias de la salud. El paquete incluye también el conjunto de datos osteo (94 pacientes diabéticos, 27 variables), utilizado como hilo conductor de los ejemplos del libro.

Para instalarlo basta con ejecutar (requiere el paquete remotes):

Mostrar el código
# Instala el paquete remotes si no lo tienes
install.packages("remotes")

# Instala BioEstatR directamente desde GitHub (compila para tu sistema)
remotes::install_github("migariane/BioEstatR")

# Cargar el paquete y el conjunto de datos osteo
library(BioEstatR)
data(osteo)

Para obtener la referencia bibliográfica del paquete:

Mostrar el código
citation("BioEstatR")
  • jamovi: Una plataforma de estadística gratuita y de código abierto diseñada para ser fácil de usar. jamovi proporciona una interfaz intuitiva basada en el motor estadístico de R, ideal para quienes desean realizar análisis complejos sin necesidad de escribir código directamente, facilitando la reproducibilidad de los resultados.

El código fuente completo de este libro está disponible en: https://github.com/migariane/CursoMatematicaEstadistica

Nota sobre el Material

Este material docente ha sido elaborado por el autor para uso docente en la Universidad de Granada. El material tiene carácter introductorio y no pretende ser un tratado exhaustivo de ninguno de los temas cubiertos. Para cada tema se proporcionan referencias para una lectura más profunda.

Aviso: Estos apuntes se encuentran en continua revisión. Si detecta algún error o imprecisión, por favor comuníquelo al autor a través del repositorio de GitHub o por correo electrónico.


Versión correspondiente al curso académico 2025–2026.