6 Semana 6 — Estimación de Parámetros

En este capítulo estudiamos los métodos fundamentales para estimar parámetros poblacionales desconocidos basándonos en datos muestrales. Cubriremos desde los conceptos básicos de estimadores puntuales hasta la construcción de intervalos de confianza, pasando por dos de los métodos más importantes: el método de momentos y la estimación por máxima verosimilitud.

6.1 El Modelo Estadístico Paramétrico

Un modelo estadístico paramétrico especifica una familia de distribuciones, cada una de las cuales es indexada por parámetros desconocidos que queremos estimar.

Definición: Modelo Estadístico Paramétrico

Un modelo estadístico paramétrico es una colección de distribuciones de probabilidad:

\[\{f(x; \boldsymbol{\theta}) : \boldsymbol{\theta} \in \Theta\}\]

donde:

\(f(x; \boldsymbol{\theta})\) es la función de densidad o de probabilidad
\(\boldsymbol{\theta} = (\theta_1, \ldots, \theta_p)\) es el vector de parámetros desconocidos
\(\Theta\) es el espacio de parámetros, el conjunto de todos los valores posibles que \(\boldsymbol{\theta}\) puede tomar

Ejemplo: Si modelamos una variable aleatoria como Normal, el modelo paramétrico es \(\{N(\mu, \sigma) : \mu \in \mathbb{R}, \sigma > 0\}\), donde los parámetros desconocidos son la media \(\mu\) y la desviación estándar \(\sigma\).

6.2 Estimadores Puntuales

Un estimador puntual es una función de la muestra que proporciona un único valor estimado para el parámetro de interés.

Definición: Estimador Puntual

Un estimador puntual de un parámetro \(\theta\) es una función de la muestra:

\[\hat{\theta} = g(X_1, X_2, \ldots, X_n)\]

Antes de observar la muestra, \(\hat{\theta}\) es una variable aleatoria que varía de muestra a muestra. Después de observar los datos muestrales \((x_1, \ldots, x_n)\), el estimador toma un valor concreto llamado estimación o valor estimado:

\[\hat{\theta} = g(x_1, x_2, \ldots, x_n)\]

Observación clave: Es importante distinguir entre:

El estimador (antes de ver los datos): variable aleatoria
El valor estimado (después de ver los datos): número concreto

6.3 Propiedades de los Estimadores

Un buen estimador debe satisfacer ciertas propiedades deseables. Las más importantes son la insesgadez, la eficiencia, la consistencia y el error cuadrático medio bajo.

6.3.1 Insesgadez

Definición: Insesgadez

Un estimador \(\hat{\theta}\) es insesgado para \(\theta\) si:

\[E(\hat{\theta}) = \theta\]

El sesgo (o bias) del estimador se define como:

\[\text{Sesgo}(\hat{\theta}) = E(\hat{\theta}) - \theta\]

Un estimador es insesgado si y solo si su sesgo es cero.

Nota Importante: Insesgadez Asintótica

Un estimador es asintóticamente insesgado si:

\[\lim_{n \to \infty} E(\hat{\theta}) = \theta\]

Es decir, el sesgo desaparece cuando el tamaño de muestra crece indefinidamente.

6.3.2 Eficiencia

La eficiencia compara la varianza de estimadores insesgados. Cuanto menor sea la varianza, más eficiente es el estimador.

Definición: Eficiencia Relativa y Absoluta

Sean \(\hat{\theta}^{(1)}\) y \(\hat{\theta}^{(2)}\) dos estimadores insesgados de \(\theta\) (es decir, \(E(\hat{\theta}^{(1)}) = E(\hat{\theta}^{(2)}) = \theta\)).

Eficiencia Relativa: \(\hat{\theta}^{(1)}\) es más eficiente que \(\hat{\theta}^{(2)}\) si: \[\text{Var}(\hat{\theta}^{(1)}) \leq \text{Var}(\hat{\theta}^{(2)})\]
Eficiencia Absoluta (o Eficiencia de Mínima Varianza): \(\hat{\theta}^{(1)}\) es eficiente para \(\theta\) si tiene la menor varianza entre todos los estimadores insesgados de \(\theta\).

6.3.3 Consistencia

Definición: Consistencia

Un estimador \(\hat{\theta}\) es consistente para \(\theta\) si se cumplen ambas condiciones:

\[\lim_{n \to \infty} E(\hat{\theta}) = \theta \quad \text{y} \quad \lim_{n \to \infty} \text{Var}(\hat{\theta}) = 0\]

Es decir, a medida que el tamaño de muestra crece, tanto el sesgo como la varianza del estimador se acercan a cero.

La consistencia garantiza que con suficientes datos, el estimador converge en probabilidad al parámetro verdadero.

6.3.4 Error Cuadrático Medio (ECM)

Resultado Importante: Descomposición del ECM

El Error Cuadrático Medio (o Mean Squared Error) se define como:

\[\text{ECM}(\hat{\theta}) = E[(\hat{\theta} - \theta)^2]\]

Se puede descomponer como:

\[\text{ECM}(\hat{\theta}) = \text{Var}(\hat{\theta}) + [\text{Sesgo}(\hat{\theta})]^2\]

Esta descomposición muestra que el error total proviene de dos fuentes: la variabilidad del estimador y su sesgo.

Un estimador con menor ECM es preferible, incluso si es ligeramente sesgado. A veces, un estimador sesgado con baja varianza tiene ECM menor que un estimador insesgado con alta varianza.

6.4 Tabla Comparativa de Estimadores Comunes

La siguiente tabla resume propiedades de estimadores frecuentemente utilizados:

Estimador	Parámetro	Sesgo	Varianza	ECM	Condiciones
\(\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i\)	\(\mu\)	0	\(\frac{\sigma^2}{n}\)	\(\frac{\sigma^2}{n}\)	Insesgado
\(\hat{\pi} = \frac{1}{n}\sum_{i=1}^n X_i\)	\(\pi\) (proporción)	0	\(\frac{\pi(1-\pi)}{n}\)	\(\frac{\pi(1-\pi)}{n}\)	Insesgado, \(X_i \sim \text{Bernoulli}(\pi)\)
\(S^{*2} = \frac{1}{n}\sum_{i=1}^n (X_i - \mu)^2\)	\(\sigma^2\) (media conocida)	0	\(\frac{2\sigma^4}{n}\)	\(\frac{2\sigma^4}{n}\)	Insesgado si \(\mu\) es conocida
\(S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2\)	\(\sigma^2\) (media desconocida)	0	\(\frac{2\sigma^4}{n-1}\)	\(\frac{2\sigma^4}{n-1}\)	Insesgado, varianza muestral
\(S'^2 = \frac{1}{n}\sum_{i=1}^n (X_i - \bar{X})^2\)	\(\sigma^2\) (media desconocida)	\(-\frac{\sigma^2}{n}\)	\(\frac{2\sigma^4(n-1)}{n^2}\)	\(\frac{\sigma^4(2n-1)}{n^2}\)	Sesgado pero asintóticamente insesgado

Nota: Para tamaños de muestra grandes, todos estos estimadores son aproximadamente insesgados y consistentes. La diferencia clave es que \(S^2\) (con divisor \(n-1\)) es insesgado incluso para muestras pequeñas.

6.5 Método de los Momentos (MoM)

El método de los momentos es uno de los procedimientos más antiguos y simples para estimar parámetros. Se basa en igualar los momentos poblacionales con los momentos muestrales.

Definición: Método de los Momentos

El método de los momentos estima los parámetros igualando los primeros \(k\) momentos poblacionales con los \(k\) momentos muestrales, donde \(k\) es el número de parámetros a estimar:

Momentos poblacionales: \(E(X^j) = \mu_j\) para \(j = 1, 2, \ldots, k\)

Momentos muestrales: \(m_j = \frac{1}{n}\sum_{i=1}^n X_i^j\) para \(j = 1, 2, \ldots, k\)

Igualación: \(m_j = \mu_j\) para \(j = 1, 2, \ldots, k\)

6.5.1 Procedimiento del Método de Momentos

El procedimiento consiste en tres pasos:

Calcular momentos poblacionales: Expresar \(E(X^j)\) en términos de los parámetros desconocidos \(\theta_1, \ldots, \theta_k\).
Invertir las expresiones: Despejar los parámetros en términos de los momentos poblacionales.
Sustituir momentos muestrales: Reemplazar los momentos poblacionales por sus versiones muestrales para obtener los estimadores.

6.5.2 Ejemplo 6.5.1: Distribución Normal

Supongamos que tenemos una muestra de una distribución Normal \(N(\mu, \sigma^2)\) con ambos parámetros desconocidos.

Paso 1: Momentos poblacionales:

Primer momento: \(E(X) = \mu\)
Segundo momento: \(E(X^2) = \mu^2 + \sigma^2\)

Paso 2: Inversión:

\(\mu = E(X)\)
\(\sigma^2 = E(X^2) - [E(X)]^2\)

Paso 3: Estimadores MoM: \[\hat{\mu}_{\text{MoM}} = \bar{X} = \frac{1}{n}\sum_{i=1}^n X_i\]

\[\hat{\sigma}^2_{\text{MoM}} = \frac{1}{n}\sum_{i=1}^n X_i^2 - \bar{X}^2 = \frac{1}{n}\sum_{i=1}^n (X_i - \bar{X})^2 = S'^2\]

Ejemplo: Estimación por Momentos en R

Cuadro 6.1: Código R

Mostrar el código

# Simular niveles de glucosa basal en ayunas (mg/dL) de 100 pacientes
# Modelo: Normal con μ = 95 mg/dL (rango normoglucemia) y σ = 12 mg/dL
set.seed(123)
glucosa <- rnorm(100, mean = 95, sd = 12)

# Momentos muestrales
m1 <- mean(glucosa)           # Primer momento muestral
m2 <- mean(glucosa^2)         # Segundo momento muestral

# Estimadores por método de momentos
mu_mom <- m1
sigma2_mom <- m2 - m1^2

cat("Estimadores por Método de Momentos (Glucosa basal, mg/dL):\n")

Estimadores por Método de Momentos (Glucosa basal, mg/dL):

Cuadro 6.2: Código R

Mostrar el código

cat("μ (MoM)  =", round(mu_mom, 2), "mg/dL\n")

μ (MoM)  = 96.1 mg/dL

Cuadro 6.3: Código R

Mostrar el código

cat("σ² (MoM) =", round(sigma2_mom, 2), "\n")

σ² (MoM) = 119

Cuadro 6.4: Código R

Mostrar el código

# Comparar con los parámetros verdaderos
cat("\nParámetros verdaderos:\n")


Parámetros verdaderos:

Cuadro 6.5: Código R

Mostrar el código

cat("μ        =", 95, "mg/dL\n")

μ        = 95 mg/dL

Cuadro 6.6: Código R

Mostrar el código

cat("σ²       =", 144, "\n")

σ²       = 144

Interpretación

El método de momentos recupera una estimación de la media próxima al verdadero μ = 95 mg/dL (μ̂ ≈ 96.1 mg/dL) y una estimación de la varianza algo inferior al verdadero σ² = 144 (σ̂² ≈ 119) — esta discrepancia refleja principalmente la variabilidad muestral del estimador (con \(n = 100\), el error estándar de \(S'^2\) es ≈ 20); el sesgo teórico (\(-\sigma^2/n \approx -1.44\)) contribuye solo marginalmente. Asintóticamente, ambas estimaciones convergen a los parámetros poblacionales, evidenciando que el procedimiento de igualar momentos muestrales con poblacionales proporciona estimadores consistentes. Esta propiedad es fundamental en estudios epidemiológicos sobre control glucémico, donde se busca estimar parámetros poblacionales de biomarcadores (glucemia, HbA1c, insulina) a partir de cohortes muestrales. El MoM es un método práctico y computacionalmente eficiente para caracterizar distribuciones de variables clínicas continuas.

6.5.3 Ejemplo 6.5.2: Distribución de Poisson

Para una distribución de Poisson \(\text{Poisson}(\lambda)\):

Momento poblacional: \(E(X) = \lambda\)
Estimador MoM: \(\hat{\lambda}_{\text{MoM}} = \bar{X}\)

6.5.4 Ejemplo 6.5.3: Distribución Gamma

Para una distribución Gamma con parámetros \(\alpha\) (forma) y \(\beta\) (tasa):

\(E(X) = \alpha/\beta\)
\(\text{Var}(X) = \alpha/\beta^2\)

Resolviendo: \[\hat{\alpha}_{\text{MoM}} = \frac{\bar{X}^2}{S^2}, \quad \hat{\beta}_{\text{MoM}} = \frac{\bar{X}}{S^2}\]

6.6 Estimación por Máxima Verosimilitud (MLE)

El método de máxima verosimilitud es el procedimiento más importante y ampliamente utilizado en estadística. Se basa en el principio de que la muestra observada es la “más probable” bajo el verdadero modelo.

6.6.1 La Función de Verosimilitud

Definición: Función de Verosimilitud

Para una muestra aleatoria simple \(\mathbf{X} = (X_1, X_2, \ldots, X_n)\) con valores observados \(\mathbf{x} = (x_1, x_2, \ldots, x_n)\), la función de verosimilitud es:

\[L(\theta; \mathbf{x}) = \prod_{i=1}^n f(x_i; \theta)\]

Si las observaciones son independientes (asunción estándar en muestreo aleatorio simple), la verosimilitud conjunta es el producto de las verosimilitudes individuales.

Interpretación: \(L(\theta; \mathbf{x})\) mide la probabilidad (o densidad de probabilidad) de observar la muestra \(\mathbf{x}\) para cada posible valor del parámetro \(\theta\).

Después de observar los datos, \(L(\theta)\) se considera como una función de \(\theta\) solamente (los datos son fijos). Diferentes valores de \(\theta\) producen diferentes valores de \(L(\theta)\).

6.6.2 El Estimador de Máxima Verosimilitud

Definición: Estimador de Máxima Verosimilitud (EMV)

El estimador de máxima verosimilitud (o MLE, del inglés) de \(\theta\) es el valor que maximiza la función de verosimilitud:

\[\hat{\theta}_{\text{MLE}} = \arg\max_{\theta \in \Theta} L(\theta; \mathbf{x})\]

Si la verosimilitud es diferenciable, el EMV satisface:

\[\frac{\partial L(\theta)}{\partial \theta}\bigg|_{\theta=\hat{\theta}} = 0\]

y verificar que es un máximo: \(\frac{\partial^2 L(\theta)}{\partial \theta^2}\bigg|_{\theta=\hat{\theta}} < 0\)

6.6.3 La Función Log-Verosimilitud

En la práctica, es más fácil maximizar el logaritmo de la verosimilitud, llamado log-verosimilitud:

\[\ell(\theta; \mathbf{x}) = \ln L(\theta; \mathbf{x}) = \sum_{i=1}^n \ln f(x_i; \theta)\]

Propiedad Fundamental

Las funciones \(L(\theta)\) y \(\ell(\theta)\) tienen el mismo máximo porque el logaritmo es una función monótona creciente:

\[\max_\theta L(\theta) \Leftrightarrow \max_\theta \ell(\theta)\]

Por lo tanto:

\[\frac{\partial \ell(\theta)}{\partial \theta}\bigg|_{\theta=\hat{\theta}} = 0 \quad \Leftrightarrow \quad \frac{\partial L(\theta)}{\partial \theta}\bigg|_{\theta=\hat{\theta}} = 0\]

Usar log-verosimilitud es computacionalmente más conveniente porque:

Convierte productos en sumas
Es numéricamente más estable
Es más fácil de derivar

6.6.4 Ejemplo 6.6.1: MLE para Distribución Binomial

Supongamos que observamos \(x\) éxitos en \(n\) ensayos Bernoulli independientes, donde \(p\) es la probabilidad desconocida de éxito.

Función de verosimilitud: \[L(p) = \binom{n}{x} p^x (1-p)^{n-x}\]

Log-verosimilitud: \[\ell(p) = \ln\binom{n}{x} + x\ln p + (n-x)\ln(1-p)\]

Derivada: \[\frac{\partial \ell}{\partial p} = \frac{x}{p} - \frac{n-x}{1-p}\]

Igualando a cero: \[\frac{x}{p} = \frac{n-x}{1-p}\] \[x(1-p) = (n-x)p\] \[x = np\]

Estimador MLE: \[\hat{p}_{\text{MLE}} = \frac{x}{n}\]

6.6.5 Ejemplo 6.6.2: MLE para Distribución Normal

Para una muestra de una distribución Normal \(N(\mu, \sigma^2)\):

Log-verosimilitud: \[\ell(\mu, \sigma^2) = -\frac{n}{2}\ln(2\pi) - \frac{n}{2}\ln(\sigma^2) - \frac{1}{2\sigma^2}\sum_{i=1}^n (x_i - \mu)^2\]

Derivadas parciales: \[\frac{\partial \ell}{\partial \mu} = \frac{1}{\sigma^2}\sum_{i=1}^n (x_i - \mu)\]

\[\frac{\partial \ell}{\partial \sigma^2} = -\frac{n}{2\sigma^2} + \frac{1}{2\sigma^4}\sum_{i=1}^n (x_i - \mu)^2\]

Igualando a cero y resolviendo: \[\hat{\mu}_{\text{MLE}} = \bar{X} = \frac{1}{n}\sum_{i=1}^n X_i\]

\[\hat{\sigma}^2_{\text{MLE}} = \frac{1}{n}\sum_{i=1}^n (X_i - \bar{X})^2 = S'^2\]

Nota: Para la media, el EMV coincide con el estimador MoM. Para la varianza, el EMV es \(S'^2\) (con divisor \(n\)), que es sesgado, mientras que el estimador por el método de momentos es también \(S'^2\) (ambos métodos coinciden en este caso, aunque son procedimientos distintos: MoM no es un EMV en general).

6.6.6 Propiedades del EMV

Propiedades Importantes del EMV

Bajo condiciones de regularidad (que suelen cumplirse en la práctica):

Consistencia: El EMV es consistente, es decir, \(\hat{\theta}_{\text{MLE}} \xrightarrow{p} \theta_0\) cuando \(n \to \infty\).
Eficiencia Asintótica: El EMV es asintóticamente eficiente; es decir, entre todos los estimadores consistentes, el EMV tiene la menor varianza asintótica.
Distribución Asintótica: Para tamaños de muestra grandes, \[\hat{\theta}_{\text{MLE}} \approx N\left(\theta_0, \frac{1}{nI(\theta_0)}\right)\]

donde \(I(\theta)\) es la información de Fisher.

Invariancia: Si \(\hat{\theta}\) es el EMV de \(\theta\), entonces \(g(\hat{\theta})\) es el EMV de \(g(\theta)\) para cualquier función \(g\).

6.7 Optimización Numérica para MLE

En muchos casos, no es posible encontrar una solución analítica para el EMV. En estos casos, usamos algoritmos numéricos de optimización.

Ejemplo: Optimización Numérica con optim() en R

Modelamos el tiempo (en días) hasta la primera hipoglucemia en 100 pacientes con diabetes tipo 1 mediante una distribución Gamma. Los parámetros shape y rate no tienen forma analítica cerrada en su EMV conjunto, por lo que recurrimos a optimización numérica.

Cuadro 6.7: Código R

Mostrar el código

# Tiempo (días) hasta primera hipoglucemia — 100 pacientes DM1
# Modelo poblacional: Gamma(shape = 2, rate = 0.5)
# E[T] = α/β = 4 días, Var[T] = α/β² = 8
set.seed(42)
tiempo_hipo <- rgamma(100, shape = 2, rate = 0.5)

# Función de log-verosimilitud negativa
# (minimizamos lo negativo para usar funciones de minimización)
neg_log_lik <- function(params, datos) {
  shape <- params[1]
  rate <- params[2]

  # Evitar parámetros no válidos
  if (shape <= 0 || rate <= 0) return(Inf)

  # Log-verosimilitud para Gamma
  # f(t; α, β) = (β^α / Γ(α)) * t^(α-1) * exp(-βt)
  -sum(dgamma(datos, shape = shape, rate = rate, log = TRUE))
}

# Valores iniciales
inicial <- c(shape = 1, rate = 1)

# Optimización numérica de Nelder-Mead
resultado <- optim(inicial, neg_log_lik, datos = tiempo_hipo,
                   method = "Nelder-Mead")

cat("Estimadores MLE numéricos — Tiempo hasta hipoglucemia (días):\n")

Estimadores MLE numéricos — Tiempo hasta hipoglucemia (días):

Cuadro 6.8: Código R

Mostrar el código

cat("Shape (α) =", round(resultado$par[1], 4), "\n")

Shape (α) = 2.1

Cuadro 6.9: Código R

Mostrar el código

cat("Rate (β)  =", round(resultado$par[2], 4), "\n")

Rate (β)  = 0.55

Cuadro 6.10: Código R

Mostrar el código

cat("Tiempo medio estimado E[T] = α/β =",
    round(resultado$par[1]/resultado$par[2], 2), "días\n")

Tiempo medio estimado E[T] = α/β = 3.81 días

Cuadro 6.11: Código R

Mostrar el código

# Valores verdaderos del modelo
cat("\nParámetros poblacionales verdaderos:\n")


Parámetros poblacionales verdaderos:

Cuadro 6.12: Código R

Mostrar el código

cat("Shape (α) = 2 ; Rate (β) = 0.5 ; E[T] = 4 días\n")

Shape (α) = 2 ; Rate (β) = 0.5 ; E[T] = 4 días

Interpretación

La optimización numérica recupera estimadores MLE de los parámetros de forma (α̂ ≈ 2.10) y tasa (β̂ ≈ 0.55) próximos a los parámetros poblacionales verdaderos (α = 2, β = 0.5), con tiempo medio estimado hasta hipoglucemia E[T] = α̂/β̂ ≈ 3.81 días (frente al valor poblacional 4 días). La pequeña discrepancia es consistente con la variabilidad muestral esperable para \(n = 100\). El algoritmo de Nelder-Mead converge adecuadamente sin necesidad de derivadas analíticas, lo cual es fundamental en aplicaciones biomédicas de análisis de supervivencia (tiempo hasta evento clínico) donde la verosimilitud carece de forma cerrada. La penalización con Inf para parámetros no admisibles y el uso de log-densidades garantizan estabilidad numérica. En diabetes tipo 1, conocer la distribución del tiempo hasta hipoglucemia permite diseñar pautas de monitorización glucémica y educación al paciente basadas en cuantiles poblacionales.

6.8 Intervalos de Confianza

Un intervalo de confianza proporciona un rango de valores plausibles para el parámetro desconocido, cuantificando la incertidumbre en nuestra estimación.

Aplicación interactiva — Intervalos de Confianza

Practica la construcción de intervalos de confianza para medias y proporciones con la aplicación Shiny: watzile.shinyapps.io/IntervalosConfianza. Incluye calculadora de tamaño muestral, simulación de cobertura y visualización paso a paso.

6.8.1 Definición de Intervalo de Confianza

Definición: Intervalo de Confianza

Un intervalo de confianza de nivel \(1-\alpha\) (o nivel de confianza \(100(1-\alpha)\%\)) para el parámetro \(\theta\) es un intervalo aleatorio \([L(\mathbf{X}), U(\mathbf{X})]\) tales que:

\[P(L(\mathbf{X}) \leq \theta \leq U(\mathbf{X})) = 1 - \alpha\]

donde \(L(\mathbf{X})\) y \(U(\mathbf{X})\) son funciones de la muestra aleatoria, y \(1-\alpha\) se llama nivel de confianza o coeficiente de confianza.

Típicamente, \(1 - \alpha = 0.90\), \(0.95\), o \(0.99\).

6.8.2 Interpretación Frecuentista

Interpretación Correcta de un IC

Antes de observar los datos: El intervalo \([L(\mathbf{X}), U(\mathbf{X})]\) es aleatorio. La afirmación \(P(L \leq \theta \leq U) = 1-\alpha\) significa que si repitiéramos el procedimiento de muestreo muchas veces, aproximadamente \(100(1-\alpha)\%\) de los intervalos resultantes contendrían el verdadero parámetro.

Después de observar los datos: El intervalo observado \([l, u]\) es fijo (con números reales). No es correcto decir “la probabilidad de que \(\theta\) esté en \([l, u]\) es \(1-\alpha\)” porque \(\theta\) es una constante desconocida, no una variable aleatoria. Simplemente decimos que el intervalo observado es una realización de un procedimiento que acierta \(100(1-\alpha)\%\) de las veces.

6.8.3 Intervalo de Confianza para la Media (Varianza Conocida)

Supuestos: - Población Normal: \(X \sim N(\mu, \sigma)\) - Varianza poblacional \(\sigma^2\) conocida - Muestra aleatoria simple de tamaño \(n\)

Distribución del estimador: \[\bar{X} \sim N\left(\mu, \frac{\sigma}{\sqrt{n}}\right) \quad \Rightarrow \quad Z = \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \sim N(0,1)\]

Construcción del IC: Para un nivel de confianza \(1-\alpha\), buscamos \(z_{1-\alpha/2}\) tal que \(P(-z_{1-\alpha/2} \leq Z \leq z_{1-\alpha/2}) = 1-\alpha\).

\[P\left(\bar{X} - z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}} \leq \mu \leq \bar{X} + z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}}\right) = 1 - \alpha\]

Intervalo de Confianza: \[\text{IC}_{1-\alpha}(\mu) = \left[\bar{x} - z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}}, \quad \bar{x} + z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}}\right]\]

6.8.4 Intervalo de Confianza para la Media (Varianza Desconocida)

Supuestos: - Población Normal: \(X \sim N(\mu, \sigma)\) - Varianza poblacional \(\sigma^2\) desconocida

Distribución del estimador: \[T = \frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t_{n-1}\]

donde \(S = \sqrt{\frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2}\) es la desviación estándar muestral.

Intervalo de Confianza: \[\text{IC}_{1-\alpha}(\mu) = \left[\bar{x} - t_{1-\alpha/2, n-1} \frac{s}{\sqrt{n}}, \quad \bar{x} + t_{1-\alpha/2, n-1} \frac{s}{\sqrt{n}}\right]\]

donde \(t_{1-\alpha/2, n-1}\) es el cuantil \((1-\alpha/2)\) de la distribución \(t\) con \(n-1\) grados de libertad.

Ejemplo: IC para la Media en R

Cuadro 6.13: Código R

Mostrar el código

# Presión arterial sistólica (mmHg) en 25 pacientes adultos
# Modelo poblacional: Normal con μ ≈ 130 mmHg y σ = 15 mmHg
set.seed(100)
pas <- rnorm(25, mean = 130, sd = 15)

# IC con t-Student (varianza desconocida) — caso habitual en clínica
resultado <- t.test(pas, conf.level = 0.95)

cat("Intervalo de Confianza 95% para la PAS media (mmHg):\n")

Intervalo de Confianza 95% para la PAS media (mmHg):

Cuadro 6.14: Código R

Mostrar el código

cat("Media muestral:", round(resultado$estimate, 2), "mmHg\n")

Media muestral: 132 mmHg

Cuadro 6.15: Código R

Mostrar el código

cat("IC: [", round(resultado$conf.int[1], 2), ",",
    round(resultado$conf.int[2], 2), "] mmHg\n")

IC: [ 127 , 136 ] mmHg

Cuadro 6.16: Código R

Mostrar el código

# IC con z (varianza poblacional σ = 15 mmHg supuesta conocida)
# Útil cuando se dispone de datos históricos/literatura
n <- length(pas)
media_muestral <- mean(pas)
sigma <- 15
error_estandar <- sigma / sqrt(n)
z_critico <- qnorm(0.975)  # α = 0.05, bilateral

IC_conocida <- c(media_muestral - z_critico * error_estandar,
                 media_muestral + z_critico * error_estandar)

cat("\nIC con varianza conocida (σ = 15 mmHg):\n")


IC con varianza conocida (σ = 15 mmHg):

Cuadro 6.17: Código R

Mostrar el código

cat("IC: [", round(IC_conocida[1], 2), ",",
    round(IC_conocida[2], 2), "] mmHg\n")

IC: [ 126 , 138 ] mmHg

6.8.5 Intervalo de Confianza para una Proporción

Supuestos: - Población dicotómica: \(P(A) = \pi\) (proporción de éxitos) - Muestra aleatoria simple de tamaño \(n\) (con \(n\) suficientemente grande) - Condiciones: \(n\pi \geq 5\) y \(n(1-\pi) \geq 5\) (o aproximadamente \(n > 30\))

Distribución del estimador: \[\hat{\pi} = \frac{X}{n} \approx N\left(\pi, \sqrt{\frac{\pi(1-\pi)}{n}}\right)\]

Problema: La varianza contiene el parámetro desconocido \(\pi\). Solución: Usar \(\hat{\pi}\) como estimador consistente de \(\pi\) en la varianza.

Intervalo de Confianza (aproximado): \[\text{IC}_{1-\alpha}(\pi) = \left[\hat{\pi} - z_{1-\alpha/2}\sqrt{\frac{\hat{\pi}(1-\hat{\pi})}{n}}, \quad \hat{\pi} + z_{1-\alpha/2}\sqrt{\frac{\hat{\pi}(1-\hat{\pi})}{n}}\right]\]

Ejemplo: IC para una Proporción en R

Cuadro 6.18: Código R

Mostrar el código

# Estudio en 200 pacientes hipertensos en seguimiento clínico:
# 132 alcanzan control adecuado de PAS (< 140/90 mmHg)

n <- 200
x <- 132
p_hat <- x / n

# Intervalo de confianza 95% para la proporción
conf_level <- 0.95
alpha <- 1 - conf_level
z_critico <- qnorm(1 - alpha/2)

error_estandar <- sqrt(p_hat * (1 - p_hat) / n)
IC <- c(p_hat - z_critico * error_estandar,
        p_hat + z_critico * error_estandar)

cat("IC 95% para la proporción de hipertensos controlados:\n")

IC 95% para la proporción de hipertensos controlados:

Cuadro 6.19: Código R

Mostrar el código

cat("Proporción muestral:", round(p_hat, 4),
    "(", round(p_hat*100, 1), "%)\n")

Proporción muestral: 0.66 ( 66 %)

Cuadro 6.20: Código R

Mostrar el código

cat("IC: [", round(IC[1], 4), ",", round(IC[2], 4), "]\n")

IC: [ 0.594 , 0.726 ]

Cuadro 6.21: Código R

Mostrar el código

cat("Interpretación: con 95% de confianza, entre el",
    round(IC[1]*100, 1), "% y el",
    round(IC[2]*100, 1), "%\n")

Interpretación: con 95% de confianza, entre el 59.4 % y el 72.6 %

Cuadro 6.22: Código R

Mostrar el código

cat("de los pacientes hipertensos poblacionales alcanzan control adecuado.\n")

de los pacientes hipertensos poblacionales alcanzan control adecuado.

6.9 Interpretación de Intervalos de Confianza

Interpretar correctamente un intervalo de confianza es fundamental. Consideremos un ejemplo:

Supongamos que construimos un IC 95% para la media y obtenemos \([48.3, 51.7]\).

Interpretación CORRECTA

“Si repitiéramos el proceso de muestreo muchas veces (con muestras de igual tamaño de la misma población) y construyéramos un intervalo de confianza del 95% para cada muestra, aproximadamente el 95% de estos intervalos contendría el verdadero valor de la media poblacional.”

En otras palabras, el IC es sobre la fiabilidad del procedimiento, no sobre la probabilidad de que un intervalo específico contenga el parámetro.

Interpretación INCORRECTA (Evitar)

“La verdadera media está en \([48.3, 51.7]\) con probabilidad 0.95”

Esto es incorrecto porque después de observar los datos, el intervalo es fijo y la verdadera media es constante (no aleatoria). El parámetro o está en el intervalo o no está.

6.10 Trabajando con Ejemplos Completos

Ejemplo: Análisis Completo de Datos de HbA1c (Diabetes Tipo 2)

Cuadro 6.23: Código R

Mostrar el código

# Datos de HbA1c (%) de 20 pacientes con diabetes tipo 2
# atendidos en la Facultad de Medicina, Universidad de Granada

hba1c <- c(7.2, 8.1, 6.8, 9.3, 7.5, 8.8, 6.5, 10.2,
           7.9, 8.4, 7.1, 9.7, 7.3, 8.6, 6.9, 11.4,
           8.2, 7.0, 9.1, 7.6)

# 1. ESTADÍSTICA DESCRIPTIVA
media_muestral <- mean(hba1c)
desv_est <- sd(hba1c)  # Usa divisor n-1 (insesgado)
n <- length(hba1c)

cat("=== ESTADÍSTICA DESCRIPTIVA ===\n")

=== ESTADÍSTICA DESCRIPTIVA ===

Cuadro 6.24: Código R

Mostrar el código

cat("n =", n, "\n")

n = 20

Cuadro 6.25: Código R

Mostrar el código

cat("Media muestral = ", round(media_muestral, 2), "%\n")

Media muestral =  8.18 %

Cuadro 6.26: Código R

Mostrar el código

cat("Desviación estándar = ", round(desv_est, 2), "%\n")

Desviación estándar =  1.28 %

Cuadro 6.27: Código R

Mostrar el código

cat("Varianza muestral = ", round(desv_est^2, 2), "\n\n")

Varianza muestral =  1.63

Cuadro 6.28: Código R

Mostrar el código

# 2. ESTIMACIÓN PUNTUAL (MLE/MoM para Normal)
cat("=== ESTIMACIÓN PUNTUAL ===\n")

=== ESTIMACIÓN PUNTUAL ===

Cuadro 6.29: Código R

Mostrar el código

cat("μ (estimado) = ", round(media_muestral, 2), "%\n")

μ (estimado) =  8.18 %

Cuadro 6.30: Código R

Mostrar el código

cat("σ² (estimado) = ", round(desv_est^2, 2), "\n\n")

σ² (estimado) =  1.63

Cuadro 6.31: Código R

Mostrar el código

# 3. INTERVALO DE CONFIANZA 95% (varianza desconocida)
cat("=== INTERVALO DE CONFIANZA (95%) ===\n")

=== INTERVALO DE CONFIANZA (95%) ===

Cuadro 6.32: Código R

Mostrar el código

t_critico <- qt(0.975, df = n - 1)
error_estandar <- desv_est / sqrt(n)
margen_error <- t_critico * error_estandar

IC_inferior <- media_muestral - margen_error
IC_superior <- media_muestral + margen_error

cat("Error estándar = ", round(error_estandar, 2), "%\n")

Error estándar =  0.29 %

Cuadro 6.33: Código R

Mostrar el código

cat("Margen de error = ", round(margen_error, 2), "%\n")

Margen de error =  0.6 %

Cuadro 6.34: Código R

Mostrar el código

cat("IC 95% = [", round(IC_inferior, 2), "%, ",
    round(IC_superior, 2), "%]\n\n")

IC 95% = [ 7.58 %,  8.78 %]

Cuadro 6.35: Código R

Mostrar el código

# Alternativamente, usar t.test()
test_result <- t.test(hba1c, conf.level = 0.95)
cat("Verificación con t.test():\n")

Verificación con t.test():

Cuadro 6.36: Código R

Mostrar el código

cat("IC 95% = [", round(test_result$conf.int[1], 2), "%, ",
    round(test_result$conf.int[2], 2), "%]\n")

IC 95% = [ 7.58 %,  8.78 %]

Interpretación: Con el 95% de confianza, el nivel medio de HbA1c poblacional en pacientes diabéticos está entre 7.58% y 8.78% (media muestral = 8.18%, \(s = 1.28\%\), \(n = 20\)). El IC no incluye el objetivo clínico de HbA1c < 7%, indicando que esta cohorte presenta un control glucémico subóptimo (por encima del objetivo terapéutico recomendado). El margen de error (~0.60%) refleja la variabilidad en control metabólico entre pacientes, lo que en práctica clínica orienta decisiones de intensificación terapéutica.

Ejemplo: MLE para tiempos entre eventos cardiovasculares

Modelamos el tiempo (en años) entre eventos cardiovasculares mayores en una cohorte de 50 pacientes con cardiopatía isquémica como una distribución Exponencial con tasa λ. La media poblacional es \(1/\lambda\) años entre eventos.

Cuadro 6.37: Código R

Mostrar el código

# Tiempo (años) entre eventos cardiovasculares — 50 pacientes
# Modelo poblacional: Exponencial con tasa λ = 0.5 eventos/año
# (i.e., un evento cada 2 años en promedio)
set.seed(999)
tiempo_eventos <- rexp(50, rate = 0.5)

# Función de log-verosimilitud para Exponencial
log_verosimilitud <- function(lambda, datos) {
  if (lambda <= 0) return(-Inf)
  sum(dexp(datos, rate = lambda, log = TRUE))
}

# Maximizar log-verosimilitud numéricamente
resultado_optim <- optimize(
  function(lambda) log_verosimilitud(lambda, tiempo_eventos),
  interval = c(0.01, 5),
  maximum = TRUE
)

lambda_mle <- resultado_optim$maximum
cat("Estimador MLE de λ:", round(lambda_mle, 4), "eventos/año\n")

Estimador MLE de λ: 0.511 eventos/año

Cuadro 6.38: Código R

Mostrar el código

cat("Log-verosimilitud máxima:",
    round(resultado_optim$objective, 2), "\n")

Log-verosimilitud máxima: -83.5

Cuadro 6.39: Código R

Mostrar el código

cat("Tiempo medio estimado entre eventos: 1/λ =",
    round(1/lambda_mle, 2), "años\n")

Tiempo medio estimado entre eventos: 1/λ = 1.96 años

Cuadro 6.40: Código R

Mostrar el código

# MoM también da λ = 1/media para Exponencial
lambda_mom <- 1 / mean(tiempo_eventos)
cat("\nEstimador MoM de λ:", round(lambda_mom, 4), "eventos/año\n")


Estimador MoM de λ: 0.511 eventos/año

Cuadro 6.41: Código R

Mostrar el código

# Para Exponencial, MLE = MoM (propiedad teórica)
cat("\nNota: Para la distribución Exponencial,\n")


Nota: Para la distribución Exponencial,

Cuadro 6.42: Código R

Mostrar el código

cat("MLE y MoM coinciden algebraicamente (λ̂ = 1/X̄).\n")

MLE y MoM coinciden algebraicamente (λ̂ = 1/X̄).

6.11 Resumen

Concepto	Definición Clave
Modelo Paramétrico	Familia de distribuciones \(\{f(x;\boldsymbol{\theta}) : \boldsymbol{\theta} \in \Theta\}\)
Estimador	Función de la muestra \(\hat{\theta} = g(X_1, \ldots, X_n)\) que varía aleatoriamente
Insesgadez	\(E(\hat{\theta}) = \theta\)
Eficiencia	Comparación de varianzas entre estimadores insesgados
Consistencia	\(\lim_{n \to \infty} E(\hat{\theta}) = \theta\) y \(\lim_{n \to \infty} \text{Var}(\hat{\theta}) = 0\)
Error Cuadrático Medio	\(\text{ECM}(\hat{\theta}) = \text{Var}(\hat{\theta}) + [\text{Sesgo}(\hat{\theta})]^2\)
Método de Momentos	Igualar momentos poblacionales con muestrales: \(E(X^j) = m_j\)
Función de Verosimilitud	\(L(\theta) = \prod_{i=1}^n f(x_i; \theta)\)
Log-Verosimilitud	\(\ell(\theta) = \ln L(\theta) = \sum_{i=1}^n \ln f(x_i; \theta)\)
Estimador MLE	\(\hat{\theta}_{\text{MLE}} = \arg\max_\theta L(\theta)\)
Intervalo de Confianza	Intervalo aleatorio \([L(\mathbf{X}), U(\mathbf{X})]\) con \(P(L \leq \theta \leq U) = 1-\alpha\)

6.11.1 Fórmulas Clave para Intervalos de Confianza

Media (varianza conocida): \[\text{IC}_{1-\alpha}(\mu) = \left[\bar{x} \pm z_{1-\alpha/2} \frac{\sigma}{\sqrt{n}}\right]\]

Media (varianza desconocida): \[\text{IC}_{1-\alpha}(\mu) = \left[\bar{x} \pm t_{1-\alpha/2, n-1} \frac{s}{\sqrt{n}}\right]\]

Proporción: \[\text{IC}_{1-\alpha}(\pi) = \left[\hat{\pi} \pm z_{1-\alpha/2} \sqrt{\frac{\hat{\pi}(1-\hat{\pi})}{n}}\right]\]

Ejemplo con BioEstatR: icm() e icp()

Documentación completa de ambas funciones en ?sec-bio-ic.

Cuadro 6.43: Código R

Mostrar el código

library(BioEstatR)

# IC para la media de HbA1c — 94 pacientes diabéticos, Fac. Medicina UGR
icm(m = mean(osteo$hba1c), s = sd(osteo$hba1c), n = nrow(osteo))


Intervalo de confianza bilateral para la media de una VA normal 
----------------------------------------------------------------
Información muestral: 
  Tamaño muestral: n =  94 
  Media: m =  8.565 
  Desviación típica: s =  1.799 
  Error estándar de la media: sem =  0.186 

Estimación: 
 95%-IC(µ):  (8.2, 8.93)
  Precisión obtenida: 0.368

Cuadro 6.44: Código R

Mostrar el código

# IC para la proporción de fumadores (41 de 94 pacientes)
icp(x = sum(osteo$tabaco == "Sí"), n = nrow(osteo))


Intervalo de confianza para una proporción binomial 
--------------------------------------------------- 

Información muestral: 
  Tamaño de muestra: n = 94
  Estimación puntual clásica: p=x/n = 0.436, q=(1-p)=0.564
  Casos observados: x = 41

# Método exacto (Clooper-Pearson):
  Pseudo-estimación puntual: p' = 0.441, q'=(1-p')=0.559
  95%-IC(π): (0.339, 0.542) 
  Semiamplitud: 0.102

# Método de Wilson (con cpc):
  Pseudo-estimación puntual: p' = 0.439, q'=(1-p')=0.561
  95%-IC(π): (0.335, 0.542) 
  Semiamplitud: 0.103

# Método de Wald (con cpc):
  Estimación puntual (clásica): p=x/n = 0.436, q=(1-p)=0.564
  95%-IC(π): (0.331, 0.542) 
  Precisión: 0.106

# Método de Wald ajustado (Agresti-Coull):
  Estimación puntual: p=(x+2)/(n+4) = 0.439, q=(1-p)=0.561
  95%-IC(π): (0.341, 0.537) 
  Precisión: 0.0982

icp() calcula cuatro métodos simultáneamente. Para muestras pequeñas se recomienda Clopper-Pearson (exacto); para muestras grandes los cuatro métodos convergen (las diferencias entre ellos disminuyen al aumentar \(n\)).

6.12 Cálculo del Tamaño Muestral: `nm()` y `np()`

Antes de iniciar un estudio clínico es esencial determinar el tamaño muestral necesario para alcanzar una precisión deseada en los intervalos de confianza. Las funciones nm() y np() del paquete BioEstatR (ver ?sec-bio-n) calculan el tamaño muestral requerido para una media o una proporción, respectivamente, dada una semiamplitud objetivo \(d\) del IC.

6.12.1 Fórmulas del Tamaño Muestral

Para la media (con estimación piloto \(s\) de la desviación típica): \[n = \left(\frac{z_{1-\alpha/2}\, s}{d}\right)^2\]

Para la proporción (con estimación piloto \(\hat{p} = x/n\)): \[n = \left(\frac{z_{1-\alpha/2}}{d}\right)^2 \hat{p}\,(1-\hat{p})\]

donde \(d\) es la semiamplitud (precisión) deseada del IC y \(z_{1-\alpha/2}\) es el cuantil normal estándar. La dependencia cuadrática \(n \propto 1/d^2\) implica que reducir la semiamplitud a la mitad cuadruplica el tamaño muestral.

Ejemplo: Tamaño muestral para HbA1c y prevalencia de tabaquismo

Partiendo del estudio piloto osteo (94 pacientes diabéticos, Fac. Medicina UGR):

HbA1c: \(\bar{x} \approx 8.57\%\), \(s \approx 1.80\). ¿Cuántos pacientes hacen falta para reducir la semiamplitud del IC a \(d = 0.3\%\)?
Tabaquismo: 41/94 fumadores (\(\hat{p} \approx 0.436\)). ¿Cuántos pacientes para alcanzar precisión \(d = 0.05\) al 95% de confianza?

Cuadro 6.45: Código R

Mostrar el código

library(BioEstatR)

# nm(): tamaño muestral para la media de HbA1c
# d = 0.3% (semiamplitud deseada), datos piloto del estudio osteo
nm(d = 0.3, n = nrow(osteo),
   m = mean(osteo$hba1c), s = sd(osteo$hba1c), alfa = 0.05)



# Tamaño de muestra para la estimación de la media de una VA normal o su aproximación
# -----------------------------------------------------------------------------------

# Muestra piloto:
  Tamaño muestral:  n = 94 
  Media: m = 8.5649 
  Desviación típica: s = 1.7987 
  Error estandar de la media: sem = 0.1855 
  Precisión observada: d = 0.3684 

# Estimación del tamaño muestral:
  Precisión deseada: δ = 0.3000 
  Tamaño muestral necesario: n ≥ 142

Cuadro 6.46: Código R

Mostrar el código

# np(): tamaño muestral para la proporción de fumadores
# d = 0.05 (semiamplitud deseada), conf = 0.95
np(x = sum(osteo$tabaco == "Sí"), n = nrow(osteo),
   d = 0.05, conf = 0.95)


Tamaño de muestra para estimar una proporción binomial 
-------------------------------------------------------

Información muestral 
  Tamaño de la muestra: n = 94
  Casos: x = 41
  Inferencia para la proporción basada en el método de Wald ajustado: 
  95%-IC(π): (0.3405, 0.5370) 
  precisión observada: d = 0.0982 (9.82%) 

Tamaño muestral requerido para δ = 0.05 (5.00%), conf.= 95% 
  - Basado en la muestra actual (po = 0.5370):   n ≥ 383
  - Sin considerar la información previa: n ≥ 385

Interpretación

El cálculo del tamaño muestral cuantifica el coste estadístico de incrementar la precisión. Para estimar la HbA1c media con una semiamplitud del IC \(\leq 0.3\%\) (frente a los \(\approx 0.37\%\) obtenidos con \(n = 94\)), se necesitarían n ≥ 142 pacientes diabéticos — un incremento del 51%. Análogamente, para estimar la prevalencia de tabaquismo con precisión \(\pm 5\%\) (IC 95%) se requerirían n ≥ 383 pacientes (usando la información de la muestra piloto), aproximadamente cuatro veces el tamaño del estudio piloto. En la fase de diseño de un protocolo clínico, estos cálculos orientan el balance entre precisión científica (estimaciones más estrechas guían mejor las decisiones terapéuticas) y viabilidad logística-financiera (reclutamiento, seguimiento, presupuesto). La dependencia cuadrática \(n \propto 1/d^2\) explica por qué ganar un factor 2 en precisión cuadruplica el coste muestral — un argumento decisivo al justificar el tamaño muestral ante comités éticos y agencias financiadoras.

6.13 Ejercicios

Concepto de Estimador: Define con tus palabras la diferencia entre un parámetro poblacional, un estimador y un valor estimado. ¿Por qué es importante considerar un estimador como una variable aleatoria?
Insesgadez vs. Eficiencia: Considera dos estimadores insesgados del mismo parámetro. ¿Cuál prefieres si uno tiene varianza dos veces mayor que el otro? Razona tu respuesta.
Error Cuadrático Medio: Explica por qué a veces puede ser preferible un estimador sesgado con baja varianza sobre uno insesgado con alta varianza. Proporciona un ejemplo numérico simple.
Método de Momentos: Para una muestra de una distribución Uniform\([0, \theta]\):
- Encuentra el estimador por método de momentos de \(\theta\)
- ¿Es insesgado?
Máxima Verosimilitud: Para una muestra de \(n\) observaciones de una distribución Poisson\((\lambda)\):
- Escribe la función de verosimilitud
- Encuentra el EMV de \(\lambda\)
- ¿Coincide con el estimador MoM?
Intervalo de Confianza: Se observa una muestra de 36 datos con \(\bar{x} = 50\) y \(s = 12\). Construye un IC 95% para la media poblacional. ¿Cómo cambiaría el intervalo si usáramos un nivel de confianza del 99%?
Intervalo de Confianza para Proporción: En una encuesta de 500 personas, 325 responden afirmativamente a una pregunta. Construye un IC 95% para la proporción poblacional e interpreta el resultado.
Programación en R: Escribe un script en R que:
- Genere una muestra de una distribución Normal\((\mu=100, \sigma=15)\) de tamaño \(n=50\)
- Calcule estimadores puntuales para \(\mu\) y \(\sigma^2\)
- Construya un IC 95% para \(\mu\)
- Verifique si el verdadero valor de \(\mu\) cae dentro del intervalo

6.14 Respuestas a los Ejercicios

Ejercicio 1: Un parámetro es el valor verdadero desconocido de la población (θ). Un estimador es una función de los datos muestrales (T(X₁,…,Xₙ)) que genera diferentes valores según la muestra. Es una variable aleatoria porque depende de la muestra. Es importante reconocer esto para entender su distribución y propiedades.

Ejercicio 2: Prefieres el estimador con menor varianza porque tendrá una distribución más concentrada alrededor del parámetro. Si ambos son insesgados, el de menor varianza es más eficiente.

Ejercicio 3: Ejemplo: θ=0, Estimador A: insesgado, Var=100; Estimador B: sesgo=2, Var=10. ECM_A = 100; ECM_B = 4 + 10 = 14. B es mejor a pesar del sesgo.

Ejercicio 4: Para Uniform[0,θ], el método de momentos da θ̂ = 2X̄. No es insesgado (subestima).

Ejercicio 5: L(λ) = λⁿe^(-nλ)∏xᵢ!/∏xᵢ!. EMV: λ̂ = X̄. Sí coincide con MoM.

Ejercicio 6: n=36, X̄=50, s=12, t₀.₀₂₅,₃₅ ≈ 2.03 IC95% = [50 ± 2.03×(12/6)] = [50 ± 4.06] = [45.94, 54.06] IC99%: más amplio ≈ [44.55, 55.45] (usa t₀.₉₉₅,₃₅ ≈ 2.72; margen 2.72×2 = 5.45)

Ejercicio 7: p̂ = 325/500 = 0.65, SE = √(0.65×0.35/500) ≈ 0.0214 IC95% = [0.65 ± 1.96×0.0214] ≈ [0.608, 0.692]

Ejercicio 8: Código R básico:

set.seed(123)
muestra <- rnorm(50, mean=100, sd=15)
media <- mean(muestra)
var_est <- var(muestra)
se <- sd(muestra)/sqrt(50)
ic <- c(media - 1.96*se, media + 1.96*se)
# Verificar: 100 ∈ ic?

6.1 El Modelo Estadístico Paramétrico

6.2 Estimadores Puntuales

6.3 Propiedades de los Estimadores

6.3.1 Insesgadez

6.3.2 Eficiencia

6.3.3 Consistencia

6.3.4 Error Cuadrático Medio (ECM)

6.4 Tabla Comparativa de Estimadores Comunes

6.5 Método de los Momentos (MoM)

6.5.1 Procedimiento del Método de Momentos

6.5.2 Ejemplo 6.5.1: Distribución Normal

6.5.3 Ejemplo 6.5.2: Distribución de Poisson

6.5.4 Ejemplo 6.5.3: Distribución Gamma

6.6 Estimación por Máxima Verosimilitud (MLE)

6.6.1 La Función de Verosimilitud

6.6.2 El Estimador de Máxima Verosimilitud

6.6.3 La Función Log-Verosimilitud

6.6.4 Ejemplo 6.6.1: MLE para Distribución Binomial

6.6.5 Ejemplo 6.6.2: MLE para Distribución Normal

6.6.6 Propiedades del EMV

6.7 Optimización Numérica para MLE

6.8 Intervalos de Confianza

6.8.1 Definición de Intervalo de Confianza

6.8.2 Interpretación Frecuentista

6.8.3 Intervalo de Confianza para la Media (Varianza Conocida)

6.8.4 Intervalo de Confianza para la Media (Varianza Desconocida)

6.8.5 Intervalo de Confianza para una Proporción

6.9 Interpretación de Intervalos de Confianza

6.10 Trabajando con Ejemplos Completos

6.11 Resumen

6.11.1 Fórmulas Clave para Intervalos de Confianza

6.12 Cálculo del Tamaño Muestral: nm() y np()

6.12.1 Fórmulas del Tamaño Muestral

6.13 Ejercicios

6.14 Respuestas a los Ejercicios

6.12 Cálculo del Tamaño Muestral: `nm()` y `np()`