Este apéndice proporciona los fundamentos matemáticos necesarios para un análisis riguroso de la probabilidad y la estadística. Este contenido está estructurado como una guía de referencia basada en principios de bioestadística.
A.1 Funciones y Gráficas
Las funciones mapean elementos de un dominio a un codominio (\(f: X \to Y\)).
- Notación: \(y = f(x)\), donde \(x\) es la variable independiente y \(y\) es la variable dependiente.
- Dominio: Conjunto de todos los posibles valores de entrada (\(x\)).
- Codominio/Rango: Conjunto de todos los posibles valores de salida (\(y\)).
- Funciones Inversas: Si una función \(f\) es biyectiva (inyectiva y sobreyectiva), existe una función inversa \(f^{-1}\) tal que \(f(f^{-1}(x)) = x\) y \(f^{-1}(f(x)) = x\).
- Composición: La composición de funciones \((f \circ g)(x)\) significa aplicar \(g\) primero, y luego \(f\) al resultado: \((f \circ g)(x) = f(g(x))\).
Ejemplos de funciones comunes: * Lineal: \(f(x) = mx + b\) * Cuadrática: \(f(x) = ax^2 + bx + c\) * Exponencial: \(f(x) = a^x\) * Logarítmica: \(f(x) = \log_b(x)\)
Ejemplo en R: Definición y uso de funciones
A.2 Exponenciales y Logaritmos
Fundamentales para modelizar relaciones de crecimiento/decrecimiento y simplificar funciones de verosimilitud en estadística.
- Propiedades Exponenciales:
- \(a^x a^y = a^{x+y}\)
- \((a^x)^y = a^{xy}\)
- \(a^0 = 1\)
- \(a^{-x} = 1/a^x\)
- \((ab)^x = a^x b^x\)
- En R,
exp(x) calcula \(e^x\).
- Propiedades Logarítmicas (base natural \(\ln\) o \(\log_e\)):
- \(\ln(xy) = \ln(x) + \ln(y)\)
- \(\ln(x/y) = \ln(x) - \ln(y)\)
- \(\ln(x^k) = k \ln(x)\)
- \(\ln(1) = 0\)
- \(\ln(e) = 1\)
- \(\log_b x = \frac{\ln x}{\ln b}\) (cambio de base)
- La relación inversa: \(e^{\ln x} = x\) y \(\ln(e^x) = x\).
- En R,
log(x) calcula \(\ln(x)\) por defecto; log10(x) para base 10, log(x, base=b) para otras bases.
Ejemplo en R: Cálculos con exponenciales y logaritmos
A.3 Sumatorias y Productos
La notación \(\sum\) representa sumas y \(\prod\) representa productos. Son esenciales para definir medias, varianzas y funciones de verosimilitud.
Notación de Sumatoria: \(\sum_{i=1}^n x_i = x_1 + x_2 + \cdots + x_n\)
Propiedades de la Suma:
- Linealidad: \(\sum_{i=1}^n (aX_i + bY_i) = a\sum_{i=1}^n X_i + b\sum_{i=1}^n Y_i\)
- Suma de una constante: \(\sum_{i=1}^n c = nc\)
Sumas dobles: \(\sum_{i=1}^m \sum_{j=1}^n x_{ij}\) para sumar elementos en una tabla o matriz.
Notación de Producto: \(\prod_{i=1}^n x_i = x_1 \cdot x_2 \cdot \ldots \cdot x_n\)
Ejemplo en R: Sumas y Productos
[,1] [,2]
[1,] 1 3
[2,] 2 4
A.4 Teoría de Conjuntos
La teoría de conjuntos es el lenguaje fundamental para describir eventos en probabilidad.
- Conjunto: Colección de objetos distintos.
- \(A = \{1, 2, 3\}\)
- \(\Omega\) = Espacio muestral (conjunto de todos los resultados posibles)
- Elemento: Un objeto dentro de un conjunto.
- \(x \in A\) (x es un elemento de A)
- \(y \notin A\) (y no es un elemento de A)
- Subconjunto: \(A \subset B\) (todos los elementos de A también están en B).
- Conjunto Vacío: \(\emptyset\) o
{} (contiene cero elementos).
- Operaciones:
- Unión (\(\cup\)): \(A \cup B = \{x | x \in A \text{ o } x \in B\}\). Elementos en \(A\) O \(B\) (o ambos).
- Intersección (\(\cap\)): \(A \cap B = \{x | x \in A \text{ y } x \in B\}\). Elementos en \(A\) Y \(B\).
- Complemento (\(A^c\) o \(A'\)): Elementos en el espacio muestral \(\Omega\) que no están en \(A\). Formalmente, \(A^c = \{x | x \in \Omega \text{ y } x \notin A\}\).
- Diferencia (\(A \setminus B\)): Elementos en \(A\) pero no en \(B\). Equivalente a \(A \cap B^c\).
- Conjuntos Disjuntos: \(A\) y \(B\) son disjuntos si \(A \cap B = \emptyset\). No tienen elementos en común.
- Partición: Una colección de conjuntos \(A_1, A_2, \ldots, A_k\) forma una partición de \(\Omega\) si son mutuamente disjuntos y su unión es \(\Omega\).
Ejemplo en R: Operaciones con conjuntos (usando vectores lógicos)
A.5 Cálculo: Derivadas e Integrales
Herramientas fundamentales para la optimización (minimización de funciones de pérdida, maximización de verosimilitud) usando derivadas y para el cálculo de probabilidades e inferencia usando integrales.
A.5.1 Derivadas
Miden la tasa de cambio instantánea de una función. En estadística, se usan para encontrar máximos y mínimos de funciones (como funciones de verosimilitud o de costo).
- Notación: \(f'(x)\), \(\frac{dy}{dx}\), \(\frac{d}{dx}f(x)\).
- Reglas Básicas:
- Constante: \(\frac{d}{dx}c = 0\)
- Potencia: \(\frac{d}{dx}x^n = nx^{n-1}\)
- Suma/Resta: \(\frac{d}{dx}(f(x) \pm g(x)) = f'(x) \pm g'(x)\)
- Producto: \(\frac{d}{dx}(f(x)g(x)) = f'(x)g(x) + f(x)g'(x)\)
- Cociente: \(\frac{d}{dx}\left(\frac{f(x)}{g(x)}\right) = \frac{f'(x)g(x) - f(x)g'(x)}{[g(x)]^2}\)
- Regla de la cadena: \(\frac{d}{dx}f(g(x)) = f'(g(x))g'(x)\)
- Exponencial: \(\frac{d}{dx}e^x = e^x\)
- Logaritmo: \(\frac{d}{dx}\ln(x) = \frac{1}{x}\)
Ejemplo: Minimización de una función (encontrar el vértice de una parábola) Sea \(f(x) = x^2 - 4x + 5\). Para encontrar el mínimo, derivamos e igualamos a cero: \(f'(x) = 2x - 4\) \(2x - 4 = 0 \implies x = 2\). Sustituyendo en \(f(x)\): \(f(2) = 2^2 - 4(2) + 5 = 4 - 8 + 5 = 1\). El mínimo es en \((2, 1)\).
Ejemplo en R: Derivación simbólica (para funciones simples)
A.5.2 Integrales
Representan el área bajo una curva y se utilizan para calcular probabilidades a partir de funciones de densidad, esperanzas y varianzas.
- Integral Indefinida (Antiderivada): \(\int f(x) dx = F(x) + C\), donde \(F'(x) = f(x)\).
- Integral Definida: \(\int_a^b f(x) dx = F(b) - F(a)\). Esto calcula el área neta entre \(f(x)\) y el eje x desde \(a\) hasta \(b\).
- Integrales Múltiples: Para funciones de densidad conjuntas.
Ejemplo: Cálculo de una probabilidad a partir de una PDF Si \(f(x)\) es la PDF, \(P(a \le X \le b) = \int_a^b f(x) dx\).
Ejemplo en R: Integración numérica
A.6 Álgebra Matricial
El álgebra matricial es indispensable en estadística multivariante, regresión lineal (donde los coeficientes se estiman usando inversas matriciales), análisis de componentes principales, y más.
- Matriz: Un arreglo rectangular de números.
- Notación: \(\mathbf{A}_{m \times n}\) (m filas, n columnas).
- Vector: Una matriz con una sola fila (vector fila) o una sola columna (vector columna).
- Tipos de Matrices:
- Identidad (\(\mathbf{I}\)): Matriz cuadrada con 1s en la diagonal y 0s en el resto. \(\mathbf{AI} = \mathbf{IA} = \mathbf{A}\).
- Transpuesta (\(\mathbf{A}^T\)): Se obtienen intercambiando filas por columnas. \((A^T)_{ij} = A_{ji}\).
- Simétrica: \(\mathbf{A} = \mathbf{A}^T\).
- Operaciones Básicas:
- Suma/Resta: Elemento a elemento (las matrices deben tener las mismas dimensiones).
- Multiplicación por un escalar: Multiplicar cada elemento por el escalar.
- Producto Matricial (\(\mathbf{AB}\)): El número de columnas de \(\mathbf{A}\) debe ser igual al número de filas de \(\mathbf{B}\).
- Si \(\mathbf{A}_{m \times p}\) y \(\mathbf{B}_{p \times n}\), entonces \((\mathbf{AB})_{m \times n}\).
- \((\mathbf{AB})_{ij} = \sum_{k=1}^p A_{ik}B_{kj}\).
- NO es conmutativo: \(\mathbf{AB} \ne \mathbf{BA}\) en general.
- Inversa de una Matriz (\(\mathbf{A}^{-1}\)): Para una matriz cuadrada \(\mathbf{A}\), si existe \(\mathbf{A}^{-1}\), entonces \(\mathbf{AA}^{-1} = \mathbf{A}^{-1}\mathbf{A} = \mathbf{I}\). Solo existe si el determinante es distinto de cero.
- Determinante (\(\det(\mathbf{A})\) o \(|\mathbf{A}|\)): Un escalar asociado a una matriz cuadrada que indica, entre otras cosas, si la matriz es invertible (si \(\det(\mathbf{A}) \ne 0\)).
Ejemplo en R: Operaciones con matrices
[,1] [,2]
[1,] 1 2
[2,] 3 4
[,1] [,2]
[1,] 5 6
[2,] 7 8
[,1] [,2]
[1,] 6 8
[2,] 10 12
[,1] [,2]
[1,] 19 22
[2,] 43 50
[1] "Transpuesta de A (A^T):"
[,1] [,2]
[1,] 1 3
[2,] 2 4
[,1] [,2]
[1,] -2.0 1.0
[2,] 1.5 -0.5
[,1] [,2]
[1,] 1 1.110223e-16
[2,] 0 1.000000e+00
A.7 Referencias
- Iowa Biostatistics Math Review: https://iowabiostat.github.io/math-review/
- Casella, G., & Berger, R. L. (2002). Statistical Inference. (Excelente para fundamentos matemáticos de la inferencia estadística).
- Spivak, M. (2006). Calculus. (Un texto clásico para un tratamiento riguroso del cálculo).
- Harville, D. A. (1997). Matrix Algebra From a Statistician’s Perspective. (Referencia avanzada para álgebra matricial en estadística).