La mayoría de los experimentos no son de carácter determinístico, es decir, no conocemos de antemano el resultado del mismo, razón por la cual, es necesario medir la posibilidad de ocurrencia de un evento en presencia de incertidumbre. A esta medición se le llama probabilidad.
Además de medir la incertidumbre de un evento, a partir de la probabilidad es posible construir modelos que permitan describir las características de una variable en una población, y a partir de éstos, hacer inferencias sobre los parámetros del modelo con base en los datos de una muestra.
Por lo tanto, resulta de vital importancia el conocimiento de los conceptos básicos de probabilidad, pues los modelos de probabilidad, son la base de la construcción de los intervalos de confianza y de los estadísticos de prueba en el juzgamiento de hipótesis.
A continuación una breve descripción de las operaciones entre conjuntos y su notación, dado que son de vital importancia en la teoría de probabilidad.
Sean \(\Omega\) el conjunto universal, \(A \in \Omega\) y \(B \in \Omega\):
Dado que el cálculo de probabilidades implica contar en algunas situaciones prácticas, a continuación se presentan algunos principios del conteo. En particular vamos a contestar la siguiente pregunta: para \(k<n\), ¿de cuántas formas se pueden seleccionar \(k\) elementos de \(n\) ?
Sean \(E_1, E_2, \ldots, E_m\) conjuntos (procesos) que NO pueden ocurrir al mismo tiempo. Si:
entonces, el número de formas en que puede ocurrir es \(\sum_{j=1}^m n_j = n_1 + n_2 + \cdots + n_m\).
¿De cuántas formas se puede cruzar un río una vez, si se cuenta con 1 bote y 2 barcos?
\[1+2 = 3\]
Sean \(E_1, E_2, \ldots, E_m\) conjuntos (procesos). Si:
entonces, el número de formas en que puede ocurrir \(E_1 \cap E_2 \cap \ldots E_m\) es \(\prod_{j=1}^m n_j=n_1 \times n_2 \times \cdots \times n_m\).
En consulta, un médico determina que su paciente debe tomar medicación para dos condiciones, para la primera tiene 3 opciones de medicamentos y para la segunda 5 , ¿cuántas posibles prescripciones diferentes puede hacer el médico?
Así, el número de prescripciones es: \(n_1 * n_2=3 * 5=15\). Nota: al resultado de la multiplicación de los \(n\) primeros enteros se le llama \(n\)!,
\[ 1 \times 2 \times \ldots \times n=n ! \]
Por definición \(0 !=1\).
Para \(k<n\), ¿de cuántas formas se pueden seleccionar \(k\) elementos de \(n\)?
1 - Si el orden importa y no es posible tener repeticiones
La operación resultante se llama permutación sin repetición: \[ P_k^n=n \times(n-1) \times \ldots \times(n-(k-1))=\frac{n !}{(n-k) !} \]
2 - Si el orden importa y es posible tener repeticiones
La operación resultante se llama permutación con repetición: \[ n^k=n \times n \times \ldots \times n \]
3 - Si el orden no importa y no es posible tener repeticiones
La operación resultante se llama combinación: \[ \left(\begin{array}{l} n \\ k \end{array}\right)=\frac{n !}{k !(n-k) !} \]
1 - ¿De cuántas maneras se puede ordenar la secuencia ATGC?
\[ P_4^4=\frac{4 !}{0 !}=24 \]
2 - ¿Cuántas posibles claves de 3 dígitos se pueden obtener con los números de 1 a 5 ?
\[ 5^3=125 \]
\[ \left(\begin{array}{c} 20 \\ 3 \end{array}\right)=\frac{20 !}{3 ! 17 !}=1140 \]
Para definir un espacio de probabilidad es preciso definir algunos conceptos previamente:
1 - Experimento aleatorio:
Un experimento aleatorio es cualquier experimento que satisface las siguientes condiciones: - Todos los posibles resultados del experimento son conocidos antes de ejecutarlo. - El resultado de cualquier ejecución del experimento no se puede conocer de antemano.
2 - Espacio muestral \(\Omega\)
El espacio muestral es el conjunto de todos los posibles resultados de un experimento aleatorio.
3 - Eventos
Cualquier subconjunto del espacio muestral se llama evento aleatorio. Cuando un evento tiene un solo elemento se denomina evento elemental o simple. El conjunto \(\Phi\) se llama evento imposible, que nunca sucede, y el conjunto \(\Omega\) se llama evento seguro, que siempre sucede. Si \(A\) es un evento y el resultado observado del experimento aleatorio es un elemento de \(A\) significa que el evento \(A\) ha sucedido.
Considere un estudio longitudinal con 3 pacientes.
4 - Medida de probabilidad:
Una medida de probabilidad es una función que le asigna un número entre 0 y 1 a los eventos de un experimento aleatorio: \[ A \longrightarrow P(A) \] y que satisface: - \(P(A) \geq 0\) - \(P(\Omega)=1\) - Si \(A_1, A_2, \ldots\) son eventos mutuamente excluyentes incluidos en \(\Omega\), entonces \[ P\left(\bigcup_{i=1}^{\infty} A_i\right)=\sum_{i=1}^{\infty} P\left(A_i\right) \]
Observe que la probabilidad de un evento \(A\), denotada con \(P(A)\), es una medida de la incertidumbre relacionada con la posibilidad de la ocurrencia del evento \(A\).
Se supone que un experimento aleatorio se repite \(n\) veces y que un evento \(A\) asociado con estos experimentos ocurre exactamente \(k\) veces. Entonces, la frecuencia relativa de \(A, h_n(A)\), se define como la proporción entre la cantidad de veces que ocurre el evento \(A\) y el número total de repeticiones del experimento aleatorio:
\[ h_n(A)=\frac{k}{n} \]
La frecuencia relativa de un evento \(A\) correspondiente a un “gran número” de repeticiones de un experimento aleatorio es igual a la probabilidad del evento \(A\), es decir
\[ P(A)=\lim _{n \rightarrow \infty} h_n(A) \]
Considerar las siguientes situaciones:
En la situación a., si se toman los registros de producción durante cierto número de días, entonces se puede calcular la probabilidad de que la producción de un día no se pueda distribuir mediante: \[\frac{\text{No. de días en los que la producción no se pudo distribuir}}{\text{No. de días en los que se tomaron los registros}}\]
Además, es correcto estimar esta probabilidad mediante el método frecuentista, porque se considera que no hay cambios en el programa de producción de un día a otro. En la situación b., si se toman los registros de seguridad de un periodo determinado de tiempo, entonces se puede calcular la probabilidad de que una persona que no trabaje en la oficina pueda pasar sin tener que anunciarse en recepción, como sigue: \[ \frac{\text { No. de personas que ingresaron al complejo sin tener que anunciarse y que no trabajan allí}}{\text { No. de personas que entraron al complejo sin trabajar en él}} \]
En este caso, es correcto calcular esta probabilidad por medio de la frecuencia relativa siempre y cuando las condiciones de seguridad no varíen drásticamente de un día a otro.
| A favor (F) | En contra (C) | NS/NR (S) | |
|---|---|---|---|
| Hombre | 15 | 21 | 2 |
| Mujer | 12 | 3 | 1 |
Al elegir una persona al azar dentro de ese grupo, calcular la probabilidad de que:
Sea \(\Omega\) un espacio muestral no vacío, \(A\) y \(B\) eventos aleatorios incluidos en \(\Omega\) y \(P()\) una medida de probabilidad sobre \(\Omega\). Entonces se satisfacen las siguientes propiedades:
Sean \(A, B\) y \(C\) eventos tales que \(P(A)=0.50, P(B)=0.26, P(C)=0.55, P(A \cap B)=0.15\) \(P(A \cap C)=0.25, P(B \cap C)=0.15\) y \(P(A \cap B \cap C)=0.05\). Con base en esta información, calcular las siguientes probabilidades: \(P(A \cup B), P\left(A \cap C^C\right), P\left(A^C \cup C\right)\).
Aplicando las propiedades se obtiene que \[ P(A \cup B)=P(A)+P(B)-P(A \cap B)=0.50+0.26-0.15=0.61. \]
\(P(A)=0.50, P(B)=0.26, P(C)=0.55, P(A \cap B)=0.15\) \(P(A \cap C)=0.25, P(B \cap C)=0.15\) y \(P(A \cap B \cap C)=0.05\)
Además, \(P(A)=P(A \cap C)+P\left(A \cap C^C\right)\) de donde \[ P\left(A \cap C^C\right)=P(A)-P(A \cap C)=0.50-0.25=0.25. \]
\(P(A)=0.50, P(B)=0.26, P(C)=0.55, P(A \cap B)=0.15\) \(P(A \cap C)=0.25, P(B \cap C)=0.15\) y \(P(A \cap B \cap C)=0.05\)
Por otra parte, utilizando las leyes de Morgan se concluye que \[ P\left(A^C \cup C\right)=1-P\left(\left(A^C \cup C\right)^C\right) \] \[ =1-P\left(A \cap C^C\right)=1-0.25=0.75 . \]
Sean A y B eventos aleatorios, la probabilidad condicional es una medida de probabilidad definida por:
\[ P\left(A \mid B\right)=\frac{P\left(A \cap B\right)}{P\left(B\right)} \]
siempre que \(P\left(B\right) \neq 0\). Dado que la probabilidad condicional también constituye una medida de probabilidad, cumple las propiedades de una medida de probabilidad.
Continuando con el ejercicio de la encuesta de opinión.
Al elegir una persona al azar:
A favor (F) En contra (C) NS/NR (S) Hombre 15 21 2 Mujer 12 3 1
\[\begin{align} P(C \mid H) &= \frac{P(C\cap H)}{P(H)}=\frac{21 / 54}{38 / 54}\\ &= \frac{21}{38} = 0.553 \end{align}\]
El teorema multiplicativo está relacionado con la probabilidad de la intersección de eventos.
\[ P\left(A \cap B\right)=P\left(A\right) P\left(B\right) \]
Una empresa dispone de dos gerentes operativos que trabajan independientemente. La probabilidad de que cada funcionario esté disponible cuando se le necesite es 0.9.
El teorema de la probabilidad total se utiliza cuando se quiere encontrar la probabilidad de un evento que se encuentra “repartido” en las partes de una partición.
Sea \(B_1 \text{ y } B_2\) una partición de \(\Omega\), es decir:
\[ B_1 \cup B_2 = \Omega \\ B_1 \cap B_2 = \phi \]
Entonces, la probabilidad de ocurrencia de un evento \(A\) se reparte en la partición de la siguiente forma: \[ \begin{aligned} P(A) & =P\left(A \cap B_1\right)+P\left(A \cap B_2\right)\\ & =P\left(A \mid B_1\right) P\left(B_1\right)+P\left(A \mid B_2\right) P\left(B_2\right)\\ \end{aligned} \]
El teorema de Bayes es ampliamente utilizado en epidemiología, especialmente en la evaluación de las características de pruebas diagnósticas. En el teorema parte de la probabilidad a priori de la ocurrencia de un evento, \(P\left(B_1\right)\), para calcular su probabilidad a posteriori, \(P\left(B_1 \mid A\right)\). \[ P\left(B_1 \mid A\right)=\frac{P\left(A \mid B_1\right) P\left(B_1\right)}{P\left(A \mid B_1\right) P\left(B_1\right)+P\left(A \mid B_2\right) P\left(B_2\right)} \]
Una empresa elabora sus productos en dos fábricas. El porcentaje de producción total que se elabora en cada fábrica es del $40% $ y del \(60\%\). Además, el porcentaje de artículos defectuosos en cada fábrica es del \(1\%\) y \(4\%\), respectivamente. Calcular la probabilidad de que un artículo que resulta ser defectuoso provenga de la primera fábrica.
De acuerdo con el teorema de Bayes se tiene que: \[ \begin{aligned} P\left(F_1 \mid D\right) & =\frac{P\left(F_1\right) P\left(D \mid F_1\right)}{ P\left(F_1\right) P\left(D\mid F_1\right) + P\left(F_2\right) P\left(D \mid F_2\right)} \\ & =\frac{P\left(F_1\right) P\left(D \mid F_1\right)}{P\left(F_1\right) P\left(D \mid F_1\right)+P\left(F_2\right) P\left(A \mid F_2\right)} \\ & =\frac{(0.4)(0.01)}{(0.4)(0.01)+(0.6)(0.04)} \\ & =0.143 . \end{aligned} \]
Por lo tanto, a probabilidad de que un artículo que resulta ser defectuoso provenga de la primera fábrica es 0.143 .
Supongamos que un examen médico es positivo para una cierta enfermedad en el \(92\%\) de los casos en los que una persona está realmente enferma, y en el \(10\%\) de los casos en los que una persona está sana. Si sabemos que el \(1\%\) de la población está realmente enferma, ¿cuál es la probabilidad de que una persona que tenga un resultado positivo en el examen realmente esté enferma?
De acuerdo con el teorema de Bayes, podemos calcular esta probabilidad como sigue:
\[ \begin{aligned} P(E \mid +) & = \frac{P(E) P(+ \mid E)}{P(E) P(+ \mid E) + P(\neg E) P(+ \mid \neg E)} \\ & = \frac{0.01 \times 0.92}{0.01 \times 0.92 + 0.99 \times 0.10} \\ & = 0.085 \end{aligned} \]
Una empresa elabora sus productos en dos fábricas. El porcentaje de producción total que se elabora en cada fábrica es del \(40\%, 10\%\) y del \(50\%\). Además, el porcentaje de artículos defectuosos en cada fábrica es del \(1\%, 2\%\) y \(4\%\), respectivamente.
Calcular la probabilidad de que un artículo que resulta estar en buen estado provenga de la primera fábrica.
Calcular la probabilidad de que un artículo que resulta ser defectuoso provenga de la segunda fábrica.
