Apéndice A — Apéndice A: Repaso Matemático Riguroso

Este apéndice proporciona los fundamentos matemáticos necesarios para un análisis riguroso de la probabilidad y la estadística. Este contenido está estructurado como una guía de referencia basada en principios de bioestadística.

A.1 A.1 Funciones y Gráficas

Las funciones mapean elementos de un dominio a un codominio (\(f: X \to Y\)).

Notación: \(y = f(x)\), donde \(x\) es la variable independiente y \(y\) es la variable dependiente.
Dominio: Conjunto de todos los posibles valores de entrada (\(x\)).
Codominio/Rango: Conjunto de todos los posibles valores de salida (\(y\)).
Funciones Inversas: Si una función \(f\) es biyectiva (inyectiva y sobreyectiva), existe una función inversa \(f^{-1}\) tal que \(f(f^{-1}(x)) = x\) y \(f^{-1}(f(x)) = x\).
Composición: La composición de funciones \((f \circ g)(x)\) significa aplicar \(g\) primero, y luego \(f\) al resultado: \((f \circ g)(x) = f(g(x))\).

Ejemplos de funciones comunes: * Lineal: \(f(x) = mx + b\) * Cuadrática: \(f(x) = ax^2 + bx + c\) * Exponencial: \(f(x) = a^x\) * Logarítmica: \(f(x) = \log_b(x)\)

Ejemplo en R: Definición y uso de funciones

Cuadro A.1: Código R

Mostrar el código

# Definir una función lineal
f_lineal <- function(x) {
  2*x + 3
}
f_lineal(5) # Resultado: 13

[1] 13

Cuadro A.2: Código R

Mostrar el código

# Graficar una función
curve(f_lineal, from = -5, to = 5,
      main = "Función Lineal f(x) = 2x + 3",
      xlab = "x", ylab = "f(x)")

A.2 A.2 Exponenciales y Logaritmos

Fundamentales para modelizar relaciones de crecimiento/decrecimiento y simplificar funciones de verosimilitud en estadística.

Propiedades Exponenciales:
- \(a^x a^y = a^{x+y}\)
- \((a^x)^y = a^{xy}\)
- \(a^0 = 1\)
- \(a^{-x} = 1/a^x\)
- \((ab)^x = a^x b^x\)
- En R, exp(x) calcula \(e^x\).
Propiedades Logarítmicas (base natural \(\ln\) o \(\log_e\)):
- \(\ln(xy) = \ln(x) + \ln(y)\)
- \(\ln(x/y) = \ln(x) - \ln(y)\)
- \(\ln(x^k) = k \ln(x)\)
- \(\ln(1) = 0\)
- \(\ln(e) = 1\)
- \(\log_b x = \frac{\ln x}{\ln b}\) (cambio de base)
- La relación inversa: \(e^{\ln x} = x\) y \(\ln(e^x) = x\).
- En R, log(x) calcula \(\ln(x)\) por defecto; log10(x) para base 10, log(x, base=b) para otras bases.

Ejemplo en R: Cálculos con exponenciales y logaritmos

Cuadro A.3: Código R

Mostrar el código

# Cálculos exponenciales
exp(1)      # e^1

[1] 2.718282

Cuadro A.4: Código R

Mostrar el código

exp(2)      # e^2

[1] 7.389056

Cuadro A.5: Código R

Mostrar el código

# Cálculos logarítmicos
log(exp(1)) # ln(e) = 1

[1] 1

Cuadro A.6: Código R

Mostrar el código

log(100)    # ln(100)

[1] 4.60517

Cuadro A.7: Código R

Mostrar el código

log(100, base = 10) # log10(100) = 2

[1] 2

Cuadro A.8: Código R

Mostrar el código

# Propiedad: log(x^k) = k * log(x)
x_val <- 5
k_val <- 3
log(x_val^k_val) == k_val * log(x_val)

[1] FALSE

A.3 A.3 Sumatorias y Productos

La notación \(\sum\) representa sumas y \(\prod\) representa productos. Son esenciales para definir medias, varianzas y funciones de verosimilitud.

Notación de Sumatoria: \(\sum_{i=1}^n x_i = x_1 + x_2 + \cdots + x_n\)
Propiedades de la Suma:
- Linealidad: \(\sum_{i=1}^n (aX_i + bY_i) = a\sum_{i=1}^n X_i + b\sum_{i=1}^n Y_i\)
- Suma de una constante: \(\sum_{i=1}^n c = nc\)
Sumas dobles: \(\sum_{i=1}^m \sum_{j=1}^n x_{ij}\) para sumar elementos en una tabla o matriz.
Notación de Producto: \(\prod_{i=1}^n x_i = x_1 \cdot x_2 \cdot \ldots \cdot x_n\)

Ejemplo en R: Sumas y Productos

Cuadro A.9: Código R

Mostrar el código

# Vector de datos
datos <- c(2, 4, 6, 8, 10)

# Suma de los datos
sum(datos)

[1] 30

Cuadro A.10: Código R

Mostrar el código

# Media muestral usando sumatoria
n_datos <- length(datos)
media <- sum(datos) / n_datos
cat("Media muestral:", media, "\n")

Media muestral: 6

Cuadro A.11: Código R

Mostrar el código

# Producto de los datos
prod(datos)

[1] 3840

Cuadro A.12: Código R

Mostrar el código

# Suma doble (ej. suma de una matriz)
matriz_ej <- matrix(1:4, nrow=2)
print(matriz_ej)

     [,1] [,2]
[1,]    1    3
[2,]    2    4

Cuadro A.13: Código R

Mostrar el código

sum(matriz_ej) # Suma todos los elementos

[1] 10

A.4 A.4 Teoría de Conjuntos

La teoría de conjuntos es el lenguaje fundamental para describir eventos en probabilidad.

Conjunto: Colección de objetos distintos.
- \(A = \{1, 2, 3\}\)
- \(\Omega\) = Espacio muestral (conjunto de todos los resultados posibles)
Elemento: Un objeto dentro de un conjunto.
- \(x \in A\) (x es un elemento de A)
- \(y \notin A\) (y no es un elemento de A)
Subconjunto: \(A \subset B\) (todos los elementos de A también están en B).
Conjunto Vacío: \(\emptyset\) o {} (contiene cero elementos).
Operaciones:
- Unión (\(\cup\)): \(A \cup B = \{x | x \in A \text{ o } x \in B\}\). Elementos en \(A\) O \(B\) (o ambos).
- Intersección (\(\cap\)): \(A \cap B = \{x | x \in A \text{ y } x \in B\}\). Elementos en \(A\) Y \(B\).
- Complemento (\(A^c\) o \(A'\)): Elementos en el espacio muestral \(\Omega\) que no están en \(A\). Formalmente, \(A^c = \{x | x \in \Omega \text{ y } x \notin A\}\).
- Diferencia (\(A \setminus B\)): Elementos en \(A\) pero no en \(B\). Equivalente a \(A \cap B^c\).
Conjuntos Disjuntos: \(A\) y \(B\) son disjuntos si \(A \cap B = \emptyset\). No tienen elementos en común.
Partición: Una colección de conjuntos \(A_1, A_2, \ldots, A_k\) forma una partición de \(\Omega\) si son mutuamente disjuntos y su unión es \(\Omega\).

Ejemplo en R: Operaciones con conjuntos (usando vectores lógicos)

Cuadro A.14: Código R

Mostrar el código

# Representación de conjuntos como vectores lógicos o numéricos
universo <- 1:10
conjuntoA <- c(1, 2, 3, 4, 5)
conjuntoB <- c(4, 5, 6, 7)

# Unión
union(conjuntoA, conjuntoB)

[1] 1 2 3 4 5 6 7

Cuadro A.15: Código R

Mostrar el código

# Intersección
intersect(conjuntoA, conjuntoB)

[1] 4 5

Cuadro A.16: Código R

Mostrar el código

# Diferencia (elementos en A que no están en B)
setdiff(conjuntoA, conjuntoB)

[1] 1 2 3

Cuadro A.17: Código R

Mostrar el código

# Complemento (respecto a 'universo')
setdiff(universo, conjuntoA)

[1]  6  7  8  9 10

Cuadro A.18: Código R

Mostrar el código

# Comprobación de disjunción (no disjuntos en este caso)
length(intersect(conjuntoA, conjuntoB)) == 0

[1] FALSE

A.5 A.5 Cálculo: Derivadas e Integrales

Herramientas fundamentales para la optimización (minimización de funciones de pérdida, maximización de verosimilitud) usando derivadas y para el cálculo de probabilidades e inferencia usando integrales.

A.5.1 A.5.1 Derivadas

Miden la tasa de cambio instantánea de una función. En estadística, se usan para encontrar máximos y mínimos de funciones (como funciones de verosimilitud o de costo).

Notación: \(f'(x)\), \(\frac{dy}{dx}\), \(\frac{d}{dx}f(x)\).
Reglas Básicas:
- Constante: \(\frac{d}{dx}c = 0\)
- Potencia: \(\frac{d}{dx}x^n = nx^{n-1}\)
- Suma/Resta: \(\frac{d}{dx}(f(x) \pm g(x)) = f'(x) \pm g'(x)\)
- Producto: \(\frac{d}{dx}(f(x)g(x)) = f'(x)g(x) + f(x)g'(x)\)
- Cociente: \(\frac{d}{dx}\left(\frac{f(x)}{g(x)}\right) = \frac{f'(x)g(x) - f(x)g'(x)}{[g(x)]^2}\)
- Regla de la cadena: \(\frac{d}{dx}f(g(x)) = f'(g(x))g'(x)\)
- Exponencial: \(\frac{d}{dx}e^x = e^x\)
- Logaritmo: \(\frac{d}{dx}\ln(x) = \frac{1}{x}\)

Ejemplo: Minimización de una función (encontrar el vértice de una parábola) Sea \(f(x) = x^2 - 4x + 5\). Para encontrar el mínimo, derivamos e igualamos a cero: \(f'(x) = 2x - 4\) \(2x - 4 = 0 \implies x = 2\). Sustituyendo en \(f(x)\): \(f(2) = 2^2 - 4(2) + 5 = 4 - 8 + 5 = 1\). El mínimo es en \((2, 1)\).

Ejemplo en R: Derivación simbólica (para funciones simples)

Cuadro A.19: Código R

Mostrar el código

# Definir una expresión simbólica
expr <- expression(x^2 - 4*x + 5)
derivada <- D(expr, "x")
print(derivada)

2 * x - 4

Cuadro A.20: Código R

Mostrar el código

# Evaluar la derivada en un punto
eval(derivada, list(x = 2)) # Debería ser 0

[1] 0

A.5.2 A.5.2 Integrales

Representan el área bajo una curva y se utilizan para calcular probabilidades a partir de funciones de densidad, esperanzas y varianzas.

Integral Indefinida (Antiderivada): \(\int f(x) dx = F(x) + C\), donde \(F'(x) = f(x)\).
Integral Definida: \(\int_a^b f(x) dx = F(b) - F(a)\). Esto calcula el área neta entre \(f(x)\) y el eje x desde \(a\) hasta \(b\).
Integrales Múltiples: Para funciones de densidad conjuntas.

Ejemplo: Cálculo de una probabilidad a partir de una PDF Si \(f(x)\) es la PDF, \(P(a \le X \le b) = \int_a^b f(x) dx\).

Ejemplo en R: Integración numérica

Cuadro A.21: Código R

Mostrar el código

# Calcular la probabilidad P(-1 <= X <= 1) para una Normal Estándar
# Usamos la función dnorm (densidad de la normal)
resultado_integral <- integrate(dnorm, lower = -1, upper = 1)
print(resultado_integral$value) # Aproximadamente 0.6827 (regla del 68%)

[1] 0.6826895

Cuadro A.22: Código R

Mostrar el código

# Para la esperanza de una variable continua con PDF f(x): E(X) = integral(x * f(x) dx)
# Ejemplo con una función simple x * exp(-x) de 0 a Inf
f_ejemplo_esperanza <- function(x) { x * dexp(x, rate = 1) } # E(X) para Exp(1) es 1/rate = 1
esperanza_numerica <- integrate(f_ejemplo_esperanza, lower = 0, upper = Inf)
print(esperanza_numerica$value) # Debería ser cercano a 1

[1] 1

A.6 A.6 Álgebra Matricial

El álgebra matricial es indispensable en estadística multivariante, regresión lineal (donde los coeficientes se estiman usando inversas matriciales), análisis de componentes principales, y más.

Matriz: Un arreglo rectangular de números.
- Notación: \(\mathbf{A}_{m \times n}\) (m filas, n columnas).
Vector: Una matriz con una sola fila (vector fila) o una sola columna (vector columna).
Tipos de Matrices:
- Identidad (\(\mathbf{I}\)): Matriz cuadrada con 1s en la diagonal y 0s en el resto. \(\mathbf{AI} = \mathbf{IA} = \mathbf{A}\).
- Transpuesta (\(\mathbf{A}^T\)): Se obtienen intercambiando filas por columnas. \((A^T)_{ij} = A_{ji}\).
- Simétrica: \(\mathbf{A} = \mathbf{A}^T\).
Operaciones Básicas:
- Suma/Resta: Elemento a elemento (las matrices deben tener las mismas dimensiones).
- Multiplicación por un escalar: Multiplicar cada elemento por el escalar.
- Producto Matricial (\(\mathbf{AB}\)): El número de columnas de \(\mathbf{A}\) debe ser igual al número de filas de \(\mathbf{B}\).
  - Si \(\mathbf{A}_{m \times p}\) y \(\mathbf{B}_{p \times n}\), entonces \((\mathbf{AB})_{m \times n}\).
  - \((\mathbf{AB})_{ij} = \sum_{k=1}^p A_{ik}B_{kj}\).
  - NO es conmutativo: \(\mathbf{AB} \ne \mathbf{BA}\) en general.
Inversa de una Matriz (\(\mathbf{A}^{-1}\)): Para una matriz cuadrada \(\mathbf{A}\), si existe \(\mathbf{A}^{-1}\), entonces \(\mathbf{AA}^{-1} = \mathbf{A}^{-1}\mathbf{A} = \mathbf{I}\). Solo existe si el determinante es distinto de cero.
Determinante (\(\det(\mathbf{A})\) o \(|\mathbf{A}|\)): Un escalar asociado a una matriz cuadrada que indica, entre otras cosas, si la matriz es invertible (si \(\det(\mathbf{A}) \ne 0\)).

Ejemplo en R: Operaciones con matrices

Cuadro A.23: Código R

Mostrar el código

# Definir matrices
A <- matrix(c(1, 2, 3, 4), nrow=2, byrow=TRUE) # Matriz 2x2
B <- matrix(c(5, 6, 7, 8), nrow=2, byrow=TRUE) # Matriz 2x2
C <- matrix(c(1, 0, 0, 1), nrow=2, byrow=TRUE) # Matriz identidad I

print("Matriz A:")

[1] "Matriz A:"

Cuadro A.24: Código R

Mostrar el código

print(A)

     [,1] [,2]
[1,]    1    2
[2,]    3    4

Cuadro A.25: Código R

Mostrar el código

print("Matriz B:")

[1] "Matriz B:"

Cuadro A.26: Código R

Mostrar el código

print(B)

     [,1] [,2]
[1,]    5    6
[2,]    7    8

Cuadro A.27: Código R

Mostrar el código

# Suma de matrices
print("A + B:")

[1] "A + B:"

Cuadro A.28: Código R

Mostrar el código

print(A + B)

     [,1] [,2]
[1,]    6    8
[2,]   10   12

Cuadro A.29: Código R

Mostrar el código

# Producto matricial
print("A %*% B:")

[1] "A %*% B:"

Cuadro A.30: Código R

Mostrar el código

print(A %*% B)

     [,1] [,2]
[1,]   19   22
[2,]   43   50

Cuadro A.31: Código R

Mostrar el código

# Transpuesta de A
print("Transpuesta de A (A^T):")

[1] "Transpuesta de A (A^T):"

Cuadro A.32: Código R

Mostrar el código

print(t(A))

     [,1] [,2]
[1,]    1    3
[2,]    2    4

Cuadro A.33: Código R

Mostrar el código

# Inversa de A
# Solo si la matriz es cuadrada y no singular (determinante != 0)
print("Inversa de A:")

[1] "Inversa de A:"

Cuadro A.34: Código R

Mostrar el código

print(solve(A))

     [,1] [,2]
[1,] -2.0  1.0
[2,]  1.5 -0.5

Cuadro A.35: Código R

Mostrar el código

# Verificar A * A_inv = I
print("A %*% solve(A):")

[1] "A %*% solve(A):"

Cuadro A.36: Código R

Mostrar el código

print(A %*% solve(A)) # Debería ser la matriz identidad

     [,1]         [,2]
[1,]    1 1.110223e-16
[2,]    0 1.000000e+00

Cuadro A.37: Código R

Mostrar el código

# Determinante de A
print("Determinante de A:")

[1] "Determinante de A:"

Cuadro A.38: Código R

Mostrar el código

print(det(A)) # (1*4 - 2*3) = 4 - 6 = -2

[1] -2

A.7 A.7 Referencias

Iowa Biostatistics Math Review: https://iowabiostat.github.io/math-review/
Casella, G., & Berger, R. L. (2002). Statistical Inference. (Excelente para fundamentos matemáticos de la inferencia estadística).
Spivak, M. (2006). Calculus. (Un texto clásico para un tratamiento riguroso del cálculo).
Harville, D. A. (1997). Matrix Algebra From a Statistician’s Perspective. (Referencia avanzada para álgebra matricial en estadística).