4 Semana 4 — Variables Aleatorias y Distribuciones de Probabilidad

4.1 Introducción

Las variables aleatorias son el concepto fundamental que conecta la teoría de la probabilidad con la estadística práctica. Esta semana exploramos los conceptos de variable aleatoria, sus funciones de distribución, y las distribuciones más importantes que usarás en bioestadística y análisis de datos.

4.2 Variables Aleatorias

Definición: Variable Aleatoria

Una variable aleatoria \(X\) es una función que asigna un número real a cada resultado en el espacio muestral. Formalmente:

\[X: \Omega \to \mathbb{R}, \quad X(\omega) = x\]

donde \(\Omega\) es el espacio muestral.

4.2.1 Tipos de Variables Aleatorias

Variable Aleatoria Discreta: Toma un número finito o infinito numerable de valores.

\[X \in \{x_1, x_2, x_3, \ldots\}\]

Variable Aleatoria Continua: Puede tomar cualquier valor en un intervalo o en toda la recta real.

\[X \in [a, b] \text{ o } X \in \mathbb{R}\]

4.2.2 Función de Probabilidad y Función de Distribución

Para variables discretas, la Función de Masa de Probabilidad (PMF) es: \[P(X = x_i) = f(x_i)\]

con propiedades:

\(f(x_i) \geq 0\) para todo \(i\)
\(\sum_i f(x_i) = 1\)

Para variables continuas, la Función de Densidad de Probabilidad (PDF) es: \[f(x) \geq 0 \text{ para todo } x\] \[\int_{-\infty}^{+\infty} f(x) \, dx = 1\]

La Función de Distribución Acumulada (CDF) es: \[F(x) = P(X \leq x)\]

con propiedades:

\(0 \leq F(x) \leq 1\)
\(F\) es no decreciente
\(\lim_{x \to -\infty} F(x) = 0\) y \(\lim_{x \to +\infty} F(x) = 1\)

Para variables continuas: \[f(x) = \frac{dF(x)}{dx}\]

4.3 Funciones de Probabilidad en R

R ofrece un conjunto consistente de funciones para trabajar con distribuciones de probabilidad. Para cualquier distribución (distribucion), se dispone de cuatro funciones prefijadas:

d (density / mass): ddistribucion(x, ...) — Calcula la función de densidad (PDF) o masa (PMF).
p (probability): pdistribucion(q, ...) — Calcula la CDF: \(P(X \le q)\).
q (quantile): qdistribucion(p, ...) — Calcula la función cuantil (inversa de CDF).
r (random): rdistribucion(n, ...) — Genera números aleatorios.

4.4 Fundamentos de Cálculo de Probabilidades: Discreta vs. Continua

Antes de explorar distribuciones específicas, es vital comprender las diferencias fundamentales en cómo calculamos probabilidades dependiendo de la naturaleza de la variable.

4.4.1 La Singularidad del Punto en Variables Continuas

En distribuciones continuas (como la Normal), la probabilidad de que una variable tome un valor puntual exacto es siempre cero: \[P(X = x) = 0\]

¿Por qué? Matemáticamente, la probabilidad de un punto se define como el área bajo la curva en un intervalo de ancho cero: \[P(X = x) = \int_{x}^{x} f(t) \, dt = 0\]

En estadística práctica, esto significa que solo tiene sentido hablar de probabilidades en intervalos: \(P(a \le X \le b) = \int_{a}^{b} f(t) \, dt\). Por lo tanto, para una continua, \(P(X \le x) = P(X < x)\).

4.4.2 El Cuidado de las Desigualdades en Variables Discretas

En variables discretas (como la Binomial), \(P(X=k) > 0\). Esto implica que debemos ser extremadamente precisos al usar operadores de comparación (\(<, \le, >, \ge\)), ya que el incluir o excluir un punto cambia el resultado significativamente.

La Regla de Oro: - \(P(X \le k) = P(X < k) + P(X=k)\) - \(P(X > k) = 1 - P(X \le k)\) - \(P(X \ge k) = 1 - P(X \le k-1)\)