La población hace referencia a la totalidad de los individuos que cumplen ciertas características sobre las que se quiere hacer un estudio. Sin embargo, no siempre es posible estudiar toda la población por cuestiones de tiempo y dinero. Es por eso que se trabaja con una muestra, es decir un número más pequeño de individuos.
La inferencia estadística es un proceso inductivo que consiste en aprender (disminuir la incertidumbre) acerca de cantidades desconocidas (parámetros) asociadas con características de una población a partir de los datos de una muestra (de la pobación).
Para que podamos hacer inferencia y evitar sesgos en los resultados que se obtengan es necesario trabajar con una muestra aleatoria y probabilística.
Que la muestra sea probabilística significa que todo individuo debe tener una probabilidad mayor a \(0\) de participar en la muestra.
Que la muestra sea aleatoria implica que la información que aporta un individuo es independiente de la que aporta otro, y que todos los individuos provienen de la misma población.
Únicamente se puede aplicar estadística descriptiva sobre esos individuos que se estudiaron, no se puede hacer ningún tipo de generalización y díficilmente los resultados podrán ser replicados.
Un estadístico es función conocida de una muestra aleatoria que no depende de ninguna cantidad desconocida. Un estimador es un estadístico cuyo propósito es estimar un parámetro poblacional a partir de la muestra. El valor observado de un estimador, es decir el número final, se cononce como estimativa.
Al proceso de obtener una estimativa se le conoce como estimación.
Fisher propuso algunos criterios para determinar la calidad de un estimador, entre ellos:
Consistencia: Mientras más datos se tengan, mayor será la probabilidad de que el estadístico sea cercado al valor real del parámetro.
Insesgamiento: Si utilizas un estadístico muchas veces sobre diferentes muestras de una misma población, el promedio de estos estadítsicos se acerca al valor real del paramétro a medida que aumenta el número de muestras.
Estimación puntual
Intervalos de confianza
Pruebas de hipótesis
La distribución muestral es la distribución de una estadística calculada a partir de muchas posibles muestras de un tamaño específico, extraídas de una población.
Supongamos que queremos estimar la media de una población con una media desconocida (). Tomamos múltiples muestras de tamaño (n) y calculamos la media de cada muestra. La distribución de todas estas medias muestrales se llama distribución muestral de la media.
Si se obtiene una muestra aleatoria de una población que obedece a cualquier modelo probabilístico, discreto o continuo, entonces si la muestra es suficientemente grande, su promedio sigue aproximadamente una distribución normal, con valor esperado igual al valor esperado de la población (\(\mu\)), y desviación estándar igual a la desviación estándar de la población, dividida por la raíz cuadrada del tamaño muestral (\(\sigma / \sqrt{n}\)).
Aproximadamente con 40 datos o más, ya se puede asumir el Teorema Central del límite.
Sea \(X_1, X_2, \ldots, X_n\) un conjunto de variables aleatorias independientes e idénticamente distribuidas de una distribución con media \(\mu\) y varianza \(\sigma^2<\infty\), esto es, \(X_1, X_2, \ldots, X_n \stackrel{\text { IID }}{\sim} F\). Para \(n\) grande, se tiene que el promedio muestral \(\bar{X}\) aproximadamente (asintóticamente) sigue una distribución Normal. Esto es, \[ \bar{X} \sim \mathrm{N}\left(\mu, \frac{\sigma^2}{n}\right) \]
Si se obtiene una muestra aleatoria de una población que obedece a cualquier modelo probabilístico, discreto o continuo, entonces si la muestra es suficientemente grande, el promedio muestral se aproxima al promedio poblacional.
La ley de los grandes números nos indica que, si se toman muchas observaciones, a la larga los errores tienden a compensarse.
Buitrago, L., & Sosa, J. (s.f.). Introducción a la Estadística. Recuperado de https://rpubs.com/jcsosam/803558
Cohen, B. H., & Lea, R. B. (2004). Essentials of statistics for the social and behavioral sciences. John Wiley & Sons.
Rangel, J. (2022). Introducción a la estadística descriptiva [Diapositivas de presentación].
Peña, D. (2014). Fundamentos de estadística. Alianza editorial.