# 06 - Teorema de Bayes
**Objetivo da aula**: ao fim desta aula, o aluno será capaz de usar o Teorema de Bayes para calcular probabilidades condicionais.



# Texto introdutório

Veja este [material em vídeo](https://youtu.be/U_8yzL0jpEY).

Se quiser, [leia este artigo](https://www.scientificamerican.com/article/what-is-bayess-theorem-an/) sobre o Teorema de Bayes.

Quando temos probabilidades condicionais, já vimos que:

<img src="figuras/venn_2.png" />

$$
P(A|B) = \frac{P(A \cap B)}{P(B)}
$$

Em várias situações, temos acesso direto (isto é, podemos medir) $P(A|B)$, mas na verdade estamos interessados em $P(B|A)$, ou vice-versa. Por exemplo:

1. Em um exame para detectar uma doença, precisamos saber a probabilidade de ter a doença dado o resultado do exame, mas só sabemos, em laboratório, a chance de um falso positivo, isto é, de o exame retornar positivo sob a hipótese de que o paciente tem a doença,
1. Em um sistema de segurança, precisamos saber a probabilidade de estar havendo um ataque dado o diagnóstico dos equipamentos, mas só conseguimos saber como os equipamentos se comportam se um ataque está acontecendo,
1. Em um chatbot, precisamos saber a probabilidade de o usuário ter a intenção de fazer a uma determinada ação dadas as palavras usadas, mas só podemos medir a probabilidade de usar as palavras dadas intenções que conhecemos.

Nessas situações, precisamos usar o Teorema de Bayes. Ele funciona da seguinte forma:

Multiplincando os dois lados da equação por $P(B)$:
$$
\begin{align*}
P(A|B) &= \frac{P(A \cap B)}{P(B)}\\
P(A|B) P(B) &= P(A \cap B)
\end{align*}
$$

Podemos fazer o mesmo com $P(B|A)$:

$$
\begin{align*}
P(B|A) &= \frac{P(B \cap A)}{P(A)}\\
P(B|A) P(A) &= P(B \cap A)
\end{align*}
$$

Como $P(A \cap B) = P(B \cap A)$, então:

$$
P(A|B)P(B) = P(B|A)P(A)
$$

(este é o Teorema de Bayes!)

E, assim, podemos "inverter" as condições da probabilidade condicional.

# Exercício 1
*Objetivo: usar o Teorema de Bayes para calcular uma probabilidade*

Em um restaurante, sabemos que:

* 10\% dos clientes pedem hamburguer
* 50\% dos clientes pedem suco
* Dentre os clientes que pedem suco, 50\% pedem hamburguer.

Sabendo que um cliente pediu hamburguer, qual é a probabilidade dele ter pedido suco?

# Exercício 2
*Objetivo: verificar o Teorema de Bayes em uma base de dados real e conectar a notação matemática a sua contrapartida computacional*

Em uma base de dados, pode ser possível calcular tanto $P(A|B)$ quanto $P(B|A)$ usando somente os dados que temos.

Usando a base de dados de clientes do iFood, calcule $P(\text{solteiro}| \text{PhD})$, isto é, a probabilidade de um cliente ser solteiro dado que sabemos que ele tem um PhD, por dois métodos:

1. Diretamente, usando filtros, e
1. Indiretamente, através de usar $P(\text{solteiro})$, $P(\text{PhD})$, $P(\text{PhD}| \text{solteiro})$ e o Teorema de Bayes.

In [6]:
import pandas as pd
df = pd.read_csv('dados/iFood/ml_project1_data.csv')
df.head()

Unnamed: 0,ID,Year_Birth,Education,Marital_Status,Income,Kidhome,Teenhome,Dt_Customer,Recency,MntWines,...,NumWebVisitsMonth,AcceptedCmp3,AcceptedCmp4,AcceptedCmp5,AcceptedCmp1,AcceptedCmp2,Complain,Z_CostContact,Z_Revenue,Response
0,5524,1957,Graduation,Single,58138.0,0,0,2012-09-04,58,635,...,7,0,0,0,0,0,0,3,11,1
1,2174,1954,Graduation,Single,46344.0,1,1,2014-03-08,38,11,...,5,0,0,0,0,0,0,3,11,0
2,4141,1965,Graduation,Together,71613.0,0,0,2013-08-21,26,426,...,4,0,0,0,0,0,0,3,11,0
3,6182,1984,Graduation,Together,26646.0,1,0,2014-02-10,26,11,...,6,0,0,0,0,0,0,3,11,0
4,5324,1981,PhD,Married,58293.0,1,0,2014-01-19,94,173,...,5,0,0,0,0,0,0,3,11,0


# Exercício 3
*Objetivo: aplicar o Teorema de Bayes em uma situação de medida laboratorial*

Ao testar um sistema de visão computacional para acesso de segurança, foram encontrados os seguintes números:

* A probabilidade do sistema aceitar como segura uma imagem que, de fato, é de um usuário autorizado ($P(+ | s)$) é de $0.90$,
* A probabilidade do sistema aceitar erroneamente uma imagem que não é de um usuário autorizado ($P(+ | \bar{s})$) é de $0.01$.
* Tipicamente, 70% das tentativas de acesso são legítimas, isto é, $P(s)=0.7$.

Se o sistema apontou que um acesso é legítimo, qual é a probabilidade de que ele seja de fato legítimo, isto é, calcule $P(s | +)$.

Para este exercício, [veja este vídeo](https://youtu.be/bISWzyi0tDE), e depois [este outro](https://youtu.be/e2tog7ojm04).

# Exercício 4
*Objetivo: usar o Teorema de Bayes para fazer um processo de classificação*

O rock é um estilo musical marcado por guitarras distorcidas. Poderíamos estimar que 90% das músicas de rock têm guitarras distorcidas. Porém, as guitarras distorcidas também aparecem no axé: 20% das músicas de axé têm guitarras distorcidas. Ao todo, as guitarras distorcidas aparecem em 70% do conjunto total de músicas de rock e axé.

1. Durante o carnaval, 90% das músicas que tocam no rádio são axé, e somente 10% são de rock. Se uma música tem guitarras distorcidas, qual é a probabilidade de se tratar de rock? Qual é a probabilidade de se tratar de axé? Qual é a escolha mais provavelmente correta?
1. Em uma viagem a Seattle, 70% das músicas que tocam na rádio são rock, ao passo que 30% são axé (desde a grande invasão tropical). Se ouço uma música com guitarras distorcidas, qual é a probabilidade de se tratar de rock? Qual é a probabilidade de se tratar de axé? Qual é a escolha mais provavelmente correta?
