06 - Teorema de Bayes#

Objetivo da aula: ao fim desta aula, o aluno será capaz de usar o Teorema de Bayes para calcular probabilidades condicionais.

Texto introdutório#

Veja este material em vídeo.

Se quiser, leia este artigo sobre o Teorema de Bayes.

Quando temos probabilidades condicionais, já vimos que:

\[ P(A|B) = \frac{P(A \cap B)}{P(B)} \]

Em várias situações, temos acesso direto (isto é, podemos medir) \(P(A|B)\), mas na verdade estamos interessados em \(P(B|A)\), ou vice-versa. Por exemplo:

  1. Em um exame para detectar uma doença, precisamos saber a probabilidade de ter a doença dado o resultado do exame, mas só sabemos, em laboratório, a chance de um falso positivo, isto é, de o exame retornar positivo sob a hipótese de que o paciente tem a doença,

  2. Em um sistema de segurança, precisamos saber a probabilidade de estar havendo um ataque dado o diagnóstico dos equipamentos, mas só conseguimos saber como os equipamentos se comportam se um ataque está acontecendo,

  3. Em um chatbot, precisamos saber a probabilidade de o usuário ter a intenção de fazer a uma determinada ação dadas as palavras usadas, mas só podemos medir a probabilidade de usar as palavras dadas intenções que conhecemos.

Nessas situações, precisamos usar o Teorema de Bayes. Ele funciona da seguinte forma:

Multiplincando os dois lados da equação por \(P(B)\): $\( \begin{align*} P(A|B) &= \frac{P(A \cap B)}{P(B)}\\ P(A|B) P(B) &= P(A \cap B) \end{align*} \)$

Podemos fazer o mesmo com \(P(B|A)\):

\[\begin{split} \begin{align*} P(B|A) &= \frac{P(B \cap A)}{P(A)}\\ P(B|A) P(A) &= P(B \cap A) \end{align*} \end{split}\]

Como \(P(A \cap B) = P(B \cap A)\), então:

\[ P(A|B)P(B) = P(B|A)P(A) \]

(este é o Teorema de Bayes!)

E, assim, podemos “inverter” as condições da probabilidade condicional.

Exercício 1#

Objetivo: usar o Teorema de Bayes para calcular uma probabilidade

Em um restaurante, sabemos que:

  • 10% dos clientes pedem hamburguer

  • 50% dos clientes pedem suco

  • Dentre os clientes que pedem suco, 50% pedem hamburguer.

Sabendo que um cliente pediu hamburguer, qual é a probabilidade dele ter pedido suco?

Exercício 2#

Objetivo: verificar o Teorema de Bayes em uma base de dados real e conectar a notação matemática a sua contrapartida computacional

Em uma base de dados, pode ser possível calcular tanto \(P(A|B)\) quanto \(P(B|A)\) usando somente os dados que temos.

Usando a base de dados de clientes do iFood, calcule \(P(\text{solteiro}| \text{PhD})\), isto é, a probabilidade de um cliente ser solteiro dado que sabemos que ele tem um PhD, por dois métodos:

  1. Diretamente, usando filtros, e

  2. Indiretamente, através de usar \(P(\text{solteiro})\), \(P(\text{PhD})\), \(P(\text{PhD}| \text{solteiro})\) e o Teorema de Bayes.

import pandas as pd
df = pd.read_csv('dados/iFood/ml_project1_data.csv')
df.head()
ID Year_Birth Education Marital_Status Income Kidhome Teenhome Dt_Customer Recency MntWines ... NumWebVisitsMonth AcceptedCmp3 AcceptedCmp4 AcceptedCmp5 AcceptedCmp1 AcceptedCmp2 Complain Z_CostContact Z_Revenue Response
0 5524 1957 Graduation Single 58138.0 0 0 2012-09-04 58 635 ... 7 0 0 0 0 0 0 3 11 1
1 2174 1954 Graduation Single 46344.0 1 1 2014-03-08 38 11 ... 5 0 0 0 0 0 0 3 11 0
2 4141 1965 Graduation Together 71613.0 0 0 2013-08-21 26 426 ... 4 0 0 0 0 0 0 3 11 0
3 6182 1984 Graduation Together 26646.0 1 0 2014-02-10 26 11 ... 6 0 0 0 0 0 0 3 11 0
4 5324 1981 PhD Married 58293.0 1 0 2014-01-19 94 173 ... 5 0 0 0 0 0 0 3 11 0

5 rows × 29 columns

Exercício 3#

Objetivo: aplicar o Teorema de Bayes em uma situação de medida laboratorial

Ao testar um sistema de visão computacional para acesso de segurança, foram encontrados os seguintes números:

  • A probabilidade do sistema aceitar como segura uma imagem que, de fato, é de um usuário autorizado (\(P(+ | s)\)) é de \(0.90\),

  • A probabilidade do sistema aceitar erroneamente uma imagem que não é de um usuário autorizado (\(P(+ | \bar{s})\)) é de \(0.01\).

  • Tipicamente, 70% das tentativas de acesso são legítimas, isto é, \(P(s)=0.7\).

Se o sistema apontou que um acesso é legítimo, qual é a probabilidade de que ele seja de fato legítimo, isto é, calcule \(P(s | +)\).

Para este exercício, veja este vídeo, e depois este outro.

Exercício 4#

Objetivo: usar o Teorema de Bayes para fazer um processo de classificação

O rock é um estilo musical marcado por guitarras distorcidas. Poderíamos estimar que 90% das músicas de rock têm guitarras distorcidas. Porém, as guitarras distorcidas também aparecem no axé: 20% das músicas de axé têm guitarras distorcidas. Ao todo, as guitarras distorcidas aparecem em 70% do conjunto total de músicas de rock e axé.

  1. Durante o carnaval, 90% das músicas que tocam no rádio são axé, e somente 10% são de rock. Se uma música tem guitarras distorcidas, qual é a probabilidade de se tratar de rock? Qual é a probabilidade de se tratar de axé? Qual é a escolha mais provavelmente correta?

  2. Em uma viagem a Seattle, 70% das músicas que tocam na rádio são rock, ao passo que 30% são axé (desde a grande invasão tropical). Se ouço uma música com guitarras distorcidas, qual é a probabilidade de se tratar de rock? Qual é a probabilidade de se tratar de axé? Qual é a escolha mais provavelmente correta?