Artículos

4.2: Probabilidad condicional - Matemáticas


A menudo, se requiere calcular la probabilidad de un evento dado que ha ocurrido otro evento.

Ejemplo ( PageIndex {1} )

¿Cuál es la probabilidad de que dos cartas extraídas al azar de una baraja de cartas sean ambas Ases?

Solución

Podría parecer que podrías usar la fórmula para la probabilidad de dos eventos independientes y simplemente multiplicar ( dfrac {4} {52} cdot dfrac {4} {52} = dfrac {1} {169} ) . Sin embargo, esto sería incorrecto porque los dos eventos no son independientes. Si la primera carta robada es un As, entonces la probabilidad de que la segunda carta sea también un As sería menor porque solo quedarían tres Ases en la baraja.

Una vez que la primera carta elegida es un As, la probabilidad de que la segunda carta elegida sea también un As se denomina probabilidad condicional de sacar un As. En este caso, la "condición" es que la primera carta sea un As. Simbólicamente, escribimos esto como:

[P ( text {As en el segundo sorteo} mid text {un As en el primer sorteo}) nonumber ]

La barra vertical "|" se lee como "dado", por lo que la expresión anterior es la abreviatura de "La probabilidad de que se saque un As en el segundo sorteo dado que se sacó un As en el primer sorteo". ¿Cuál es esta probabilidad? Después de sacar un As en el primer sorteo, quedan 3 Ases de un total de 51 cartas. Esto significa que la probabilidad condicional de sacar un As después de que ya se haya extraído un As es ( dfrac {3} {51} = dfrac {1} {17} ).

Por lo tanto, la probabilidad de que ambas cartas sean ases es ( dfrac {4} {52} cdot dfrac {3} {51} = dfrac {12} {2652} = dfrac {1} {221} )

La probabilidad condicional

La probabilidad de que ocurra el evento (B ), dado que el evento (A ) ha ocurrido, se representa como (P (B mid A) ). Esto se lee como "la probabilidad de (B ) dada (A )"

Entonces, la probabilidad de que ocurran (A ) y (B ) es esta probabilidad condicional MULTIPLICADA por la probabilidad de que A ocurra, es decir, (P (A text {y} B) = P (A) P (B mid A) )

Ejemplo ( PageIndex {2} )

Calcula la probabilidad de que un dado arrojado muestre un 6, dado que una moneda lanzada muestra una cara.

Solución

Estos son dos eventos independientes, por lo que la probabilidad de que el dado obtenga un 6 es ( dfrac {1} {6} ) independientemente del resultado del lanzamiento de la moneda.

Ejemplo ( PageIndex {3} )

La siguiente tabla muestra la cantidad de sujetos de la encuesta que recibieron una multa por exceso de velocidad en el último año y el color de su automóvil. Encuentre la probabilidad de que una persona elegida al azar:

  1. Tiene una multa por exceso de velocidad dado ellos tienen un carro rojo
  2. Tiene un carro rojo dado tienen una multa por exceso de velocidad

Solución

Tabla ( PageIndex {1} )

Multa por exceso de velocidad

Sin multa por exceso de velocidad

Total

carro rojo

15

135

150

No coche rojo

45

470

515

Total

60

605

665

  1. Como sabemos que la persona tiene un automóvil rojo, solo estamos considerando a las 150 personas en la primera fila de la tabla. De ellos, 15 tienen una multa por exceso de velocidad, por lo que [P ( text {ticket} mid text {coche rojo}) = dfrac {15} {150} = dfrac {1} {10} = 0.1 nonumber ]
  2. Como sabemos que la persona tiene una multa por exceso de velocidad, solo estamos considerando a las 60 personas en la primera columna de la tabla. De ellos, 15 tienen un carro rojo, entonces [P ( text {carro rojo} mid text {ticket}) = dfrac {15} {60} = dfrac {1} {4} = 0.25 nonumber ]

Observe en el último ejemplo que (P (B | A) ) no es igual a (P (A | B) ).

Este tipo de probabilidades condicionales son las que utilizan las compañías de seguros para determinar las tarifas de sus seguros. Observan la probabilidad condicional de que usted tenga un accidente, dada su edad, su automóvil, el color de su automóvil, su historial de manejo, etc., y fijan el precio de su póliza en función de esa probabilidad.

Ejemplo ( PageIndex {4} )

Si saca 2 cartas de una baraja, ¿cuál es la probabilidad de que ambas sean espadas?

Solución

La probabilidad de que la primera carta sea una espada es ( dfrac {13} {52} = dfrac {1} {4} )

La probabilidad de que la segunda carta sea una pala, dado que la primera era una pala, es ( dfrac {12} {51} ), ya que hay una pala menos en la baraja y una carta menos en total. Nota ( dfrac {12} {51} = dfrac {4} {17} )

La probabilidad de que ambas cartas sean espadas es ( dfrac {1} {4} cdot dfrac {4} {17} = dfrac {1} {17} approx 0.0588 )

Ejemplo ( PageIndex {5} )

Si sacas dos cartas de un mazo, ¿cuál es la probabilidad de que obtengas el As de Diamantes y una carta negra?

Solución

Puede satisfacer esta condición teniendo el Caso A o el Caso B, de la siguiente manera:

Caso A) puede obtener el As de Diamantes primero y luego una carta negra o

Caso B) puedes conseguir primero una carta negra y luego el As de Diamantes.

Calculemos la probabilidad del Caso A:

La probabilidad de que la primera carta sea el as de diamantes es ( dfrac {1} {52} ). La probabilidad de que la segunda carta sea negra dado que la primera carta es el As de diamantes es ( dfrac {26} {51} ) porque 26 de las 51 cartas restantes son negras. Por tanto, la probabilidad es ( dfrac {1} {52} cdot dfrac {26} {51} = dfrac {1} {102} )

Ahora para el caso B:

La probabilidad de que la primera carta sea negra es ( dfrac {26} {52} = dfrac {1} {2} ). La probabilidad de que la segunda carta sea el as de diamantes dado que la primera carta es negra es ( dfrac {1} {51} ). Por lo tanto, la probabilidad del Caso B es ( dfrac {1} {2} cdot dfrac {1} {52} = dfrac {1} {102} ), la misma que la probabilidad del Caso 1.

Recuerda que la probabilidad de (A ) o (B ) es (P (A) + P (B) - P ( text {A y B}) ). En este problema, (P ( text {A y B}) = 0 ) ya que está claro que el Caso A y el Caso B no pueden ocurrir ambos. Por lo tanto, la probabilidad del caso A o del caso B es ( dfrac {1} {102} + dfrac {1} {102} = dfrac {2} {102} = dfrac {1} {51} ) . La probabilidad de que obtengas el As de Diamantes y una carta negra al robar dos cartas de un mazo es ( dfrac {1} {51} ).

Pruébelo ahora 4

En tu cajón tienes 10 pares de calcetines, 6 de los cuales son blancos. Si mete la mano y agarra dos pares de calcetines al azar, ¿cuál es la probabilidad de que ambos sean blancos?

Ejemplo ( PageIndex {6} )

A las mujeres se les realizó una prueba de embarazo en el hogar, luego se verificó el embarazo mediante análisis de sangre. La siguiente tabla muestra los resultados de la prueba de embarazo casera. Encontrar

  1. (P ( text {no embarazada} mid text {resultado positivo de la prueba}) )
  2. (P ( text {resultado positivo de la prueba} mid text {no embarazada}) )

Solución

Tabla ( PageIndex {2} )

Prueba positiva

Prueba negativa

Total

Embarazada

70

4

74

No embarazada

5

14

19

Total

75

18

93

  1. Como sabemos que el resultado de la prueba fue positivo, estamos limitados a las 75 mujeres en la primera columna, de las cuales 5 no estaban embarazadas. [P ( text {no embarazada} mid text {resultado positivo de la prueba}) = dfrac {5} {75} approx 0.067 nonumber ]
  2. Como sabemos que la mujer no está embarazada, estamos limitados a las 19 mujeres de la segunda fila, de las cuales 5 dieron positivo en la prueba. [P ( text {resultado positivo de la prueba} mid text {no embarazada}) = dfrac {5} {19} approx 0.263 nonumber ]

El segundo resultado es lo que generalmente se llama un falso positivo: un resultado positivo cuando la mujer no está realmente embarazada. Los falsos positivos merecen mucha atención; debido a su importancia en la vida cotidiana, profundice en esta idea a continuación.

Concentrémonos ahora en los problemas de probabilidad condicional más complejos que comenzamos a analizar anteriormente.

Ejemplo ( PageIndex {7} )

Supongamos que una determinada enfermedad tiene una tasa de incidencia del 0,1% (es decir, afecta al 0,1% de la población). Se ha diseñado una prueba para detectar esta enfermedad. La prueba no produce falsos negativos (es decir, cualquier persona que tenga la enfermedad dará positivo en la prueba), pero la tasa de falsos positivos es del 5% (es decir, aproximadamente el 5% de las personas que se someten a la prueba darán positivo a pesar de que no tiene la enfermedad). Suponga que una persona seleccionada al azar toma la prueba y da positivo. ¿Cuál es la probabilidad de que esta persona realmente tenga la enfermedad?

Solución

Hay dos formas de abordar la solución a este problema. Uno involucra un resultado importante en la teoría de la probabilidad llamado teorema de Bayes, que discutiremos un poco más adelante, pero por ahora usaremos un enfoque alternativo y, esperamos, mucho más intuitivo.

Analicemos la información del problema pieza por pieza.

Supongamos que una determinada enfermedad tiene una tasa de incidencia del 0,1% (es decir, afecta al 0,1% de la población). El porcentaje 0.1% se puede convertir a un número decimal moviendo el lugar decimal dos lugares a la izquierda, para obtener 0.001. A su vez, 0,001 se puede reescribir como una fracción: 1/1000. Esto nos dice que aproximadamente 1 de cada 1000 personas tiene la enfermedad. (Si quisiéramos, podríamos escribir (P ( text {enfermedad}) = 0.001 ))

Se ha diseñado una prueba para detectar esta enfermedad. La prueba no produce falsos negativos (es decir, cualquier persona que tenga la enfermedad dará positivo en la prueba). Esta parte es bastante sencilla: todos los que tienen la enfermedad darán positivo en la prueba o, alternativamente, todos los que dan negativo no tienen la enfermedad. (También podríamos decir (P ( text {positivo} mid text {enfermedad}) = 1 ))

La tasa de falsos positivos es del 5% (es decir, aproximadamente el 5% de las personas que se someten a la prueba darán positivo aunque no tengan la enfermedad). Esto es aún más sencillo. Otra forma de verlo es que de cada 100 personas que se hacen la prueba y no tienen la enfermedad, 5 darán positivo aunque no tengan la enfermedad. (También podríamos decir que (P ( text {positivo} mid text {sin enfermedad}) = 0.05 )

Suponga que una persona seleccionada al azar toma la prueba y da positivo. ¿Cuál es la probabilidad de que esta persona realmente tenga la enfermedad? Aquí queremos calcular (P ( text {enfermedad} mid text {positivo}) ). Ya sabemos que (P ( text {positivo} mid text {enfermedad}) = 1 ), pero recuerde que las probabilidades condicionales no son iguales si se cambian las condiciones.

En lugar de pensar en términos de todas estas probabilidades que hemos desarrollado, creemos una situación hipotética y apliquemos los hechos como se indicó anteriormente. Primero, suponga que seleccionamos al azar a 1000 personas y administramos la prueba. ¿Cuántos esperamos que padezcan la enfermedad? Dado que aproximadamente 1/1000 de todas las personas padecen la enfermedad, 1/1000 de 1000 personas es 1. (Ahora ya sabe por qué elegimos 1000). Sólo 1 de 1000 sujetos de prueba realmente tiene la enfermedad; los otros 999 no lo hacen.

También sabemos que el 5% de todas las personas que no tienen la enfermedad darán positivo en la prueba. Hay 999 personas libres de la enfermedad, por lo que esperaríamos que (0.05) (999) = 49.95 (es decir, alrededor de 50) personas que no tienen la enfermedad den positivo en la prueba.

Ahora volvamos a la pregunta original, calculando (P ( text {enfermedad} mid text {positivo}) ). Hay 51 personas que dieron positivo en nuestro ejemplo (la única persona desafortunada que realmente tiene la enfermedad, más las 50 personas que dieron positivo pero no lo hicieron). Solo una de estas personas tiene la enfermedad, por lo que

[P ( text {enfermedad} mid text {positivo}) approx dfrac {1} {51} approx 0.0196 nonumber ]

o menos del 2%. ¿Esto te sorprende? Esto significa que de todas las personas que dan positivo, más del 98% no tiene la enfermedad.

La respuesta que obtuvimos fue ligeramente aproximada, ya que redondeamos 49.95 a 50. Podríamos rehacer el problema con 100,000 sujetos de prueba, 100 de los cuales tendrían la enfermedad y (0.05) (99,900) = 4995 dieron positivo pero no tienen la enfermedad, por lo que la probabilidad exacta de tener la enfermedad si la prueba es positiva es

[P ( text {enfermedad} mid text {positivo}) approx dfrac {100} {5095} approx 0.0196 nonumber ]

que es prácticamente la misma respuesta.

Pero volvamos al sorprendente resultado. De todas las personas que dan positivo, más del 98% no tienen la enfermedad.. Si su suposición de la probabilidad de que una persona que da positivo en la prueba tenga la enfermedad fue muy diferente de la respuesta correcta (2%), no se sienta mal. Exactamente el mismo problema se planteó a los médicos y estudiantes de medicina de la Facultad de Medicina de Harvard hace 25 años y los resultados se revelaron en 1978. Revista de Medicina de Nueva Inglaterra artículo. Solo alrededor del 18% de los participantes obtuvieron la respuesta correcta. La mayoría del resto pensó que la respuesta estaba más cerca del 95% (quizás fueron engañados por la tasa de falsos positivos del 5%).

Entonces, al menos debería sentirse un poco mejor porque un grupo de médicos tampoco obtuvieron la respuesta correcta (suponiendo que pensara que la respuesta era mucho más alta). Pero la importancia de este hallazgo y resultados similares de otros estudios en los años intermedios no radica en hacer que los estudiantes de matemáticas se sientan mejor, sino en las consecuencias posiblemente catastróficas que podría tener para la atención del paciente. Si un médico cree que las posibilidades de que un resultado positivo de la prueba casi garantice que un paciente tiene una enfermedad, podría comenzar un régimen de tratamiento innecesario y posiblemente dañino en un paciente sano. O peor aún, como en los primeros días de la crisis del sida, cuando ser VIH positivo a menudo se equiparaba con una sentencia de muerte, el paciente podía tomar una acción drástica y suicidarse.

Como hemos visto en este ejemplo hipotético, el curso de acción más responsable para tratar a un paciente que da positivo sería aconsejar al paciente que lo más probable es que lo haga. no tiene la enfermedad y solicitar más pruebas más fiables para verificar el diagnóstico.

Una de las razones por las que los médicos y estudiantes de medicina en el estudio lo hicieron tan mal es que tales problemas, cuando se presentan en los tipos de cursos de estadística que suelen tomar los estudiantes de medicina, se resuelven mediante el uso del teorema de Bayes, que se establece de la siguiente manera:

Teorema de Bayes

[P (A mid B) = dfrac {P (A) P (B mid A)} {P (A) P (B mid A) + P ( bar {A}) P (B mid bar {A})} nonumber ]

En nuestro ejemplo anterior, esto se traduce en

[P ( text {enfermedad} mid text {positivo}) = dfrac {P ( text {enfermedad}) P ( text {positivo} mid text {enfermedad})} {P ( text {enfermedad}) P ( text {positivo} mid text {enfermedad}) + P ( text {sin enfermedad}) P ( text {positivo} mid text {sin enfermedad})} nonumber ]

Conectando los números da

[P ( text {enfermedad} mid text {positivo}) = dfrac {(0.001) (1)} {(0.001) (1) + (0.999) (0.05)} = 0.0196 nonumber ]

que es exactamente la misma respuesta que nuestra solución original.

El problema es que es mucho más probable que usted (o el típico estudiante de medicina, o incluso el típico profesor de matemáticas) pueda recordar la solución original que el teorema de Bayes. Psicólogos, como Gerd Gigerenzer, autor de Riesgos calculados: cómo saber cuándo los números te engañan, han abogado por que el método involucrado en la solución original (que Gigerenzer llama el método de "frecuencias naturales") sea empleado en lugar del Teorema de Bayes. Gigerenzer realizó un estudio y descubrió que aquellos educados en el método de frecuencia natural eran capaces de recordarlo mucho más tiempo que aquellos a quienes se les enseñó el teorema de Bayes. Cuando uno considera las posibles consecuencias de vida o muerte asociadas con tales cálculos, parece prudente prestar atención a su consejo.

Ejemplo ( PageIndex {8} )

Cierta enfermedad tiene una tasa de incidencia del 2%. Si la tasa de falsos negativos es del 10% y la tasa de falsos positivos es del 1%, calcule la probabilidad de que una persona que da positivo en la prueba realmente tenga la enfermedad.

Solución

Imagínese a 10,000 personas a las que se les hace la prueba. De estos 10,000, 200 tendrán la enfermedad; El 10% de ellos, o 20, darán negativo y los 180 restantes darán positivo. De los 9800 que no tienen la enfermedad, 98 darán positivo. Entonces, del total de 278 personas que dan positivo en la prueba, 180 tendrán la enfermedad. Por lo tanto

[P ( text {enfermedad} mid text {positivo}) = dfrac {180} {278} approx 0.647 nonumber ]

por lo que aproximadamente el 65% de las personas que dan positivo en la prueba tendrán la enfermedad.

Usar el teorema de Bayes directamente daría el mismo resultado:

[P ( text {enfermedad} mid text {positivo}) = dfrac {(0.02) (0.90)} {(0.02) (0.90) + (0.98) (0.01)} = dfrac {0.018} { 0.0278} aproximadamente 0.647 nonumber ]

Pruébelo ahora 5

Cierta enfermedad tiene una tasa de incidencia del 0,5%. Si no hay falsos negativos y si la tasa de falsos positivos es del 3%, calcule la probabilidad de que una persona que da positivo en la prueba realmente tenga la enfermedad.


Ver el vídeo: Probabilidad Condicional Introducción (Septiembre 2021).