06 - Teorema de Bayes#
Objetivo da aula: ao fim desta aula, o aluno será capaz de usar o Teorema de Bayes para calcular probabilidades condicionais.
Texto introdutório#
Veja este material em vídeo.
Se quiser, leia este artigo sobre o Teorema de Bayes.
Quando temos probabilidades condicionais, já vimos que:

Em várias situações, temos acesso direto (isto é, podemos medir) \(P(A|B)\), mas na verdade estamos interessados em \(P(B|A)\), ou vice-versa. Por exemplo:
Em um exame para detectar uma doença, precisamos saber a probabilidade de ter a doença dado o resultado do exame, mas só sabemos, em laboratório, a chance de um falso positivo, isto é, de o exame retornar positivo sob a hipótese de que o paciente tem a doença,
Em um sistema de segurança, precisamos saber a probabilidade de estar havendo um ataque dado o diagnóstico dos equipamentos, mas só conseguimos saber como os equipamentos se comportam se um ataque está acontecendo,
Em um chatbot, precisamos saber a probabilidade de o usuário ter a intenção de fazer a uma determinada ação dadas as palavras usadas, mas só podemos medir a probabilidade de usar as palavras dadas intenções que conhecemos.
Nessas situações, precisamos usar o Teorema de Bayes. Ele funciona da seguinte forma:
Multiplincando os dois lados da equação por \(P(B)\): $\( \begin{align*} P(A|B) &= \frac{P(A \cap B)}{P(B)}\\ P(A|B) P(B) &= P(A \cap B) \end{align*} \)$
Podemos fazer o mesmo com \(P(B|A)\):
Como \(P(A \cap B) = P(B \cap A)\), então:
(este é o Teorema de Bayes!)
E, assim, podemos “inverter” as condições da probabilidade condicional.
Exercício 1#
Objetivo: usar o Teorema de Bayes para calcular uma probabilidade
Em um restaurante, sabemos que:
10% dos clientes pedem hamburguer
50% dos clientes pedem suco
Dentre os clientes que pedem suco, 50% pedem hamburguer.
Sabendo que um cliente pediu hamburguer, qual é a probabilidade dele ter pedido suco?
Exercício 2#
Objetivo: verificar o Teorema de Bayes em uma base de dados real e conectar a notação matemática a sua contrapartida computacional
Em uma base de dados, pode ser possível calcular tanto \(P(A|B)\) quanto \(P(B|A)\) usando somente os dados que temos.
Usando a base de dados de clientes do iFood, calcule \(P(\text{solteiro}| \text{PhD})\), isto é, a probabilidade de um cliente ser solteiro dado que sabemos que ele tem um PhD, por dois métodos:
Diretamente, usando filtros, e
Indiretamente, através de usar \(P(\text{solteiro})\), \(P(\text{PhD})\), \(P(\text{PhD}| \text{solteiro})\) e o Teorema de Bayes.
import pandas as pd
df = pd.read_csv('dados/iFood/ml_project1_data.csv')
df.head()
ID | Year_Birth | Education | Marital_Status | Income | Kidhome | Teenhome | Dt_Customer | Recency | MntWines | ... | NumWebVisitsMonth | AcceptedCmp3 | AcceptedCmp4 | AcceptedCmp5 | AcceptedCmp1 | AcceptedCmp2 | Complain | Z_CostContact | Z_Revenue | Response | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 5524 | 1957 | Graduation | Single | 58138.0 | 0 | 0 | 2012-09-04 | 58 | 635 | ... | 7 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 11 | 1 |
1 | 2174 | 1954 | Graduation | Single | 46344.0 | 1 | 1 | 2014-03-08 | 38 | 11 | ... | 5 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 11 | 0 |
2 | 4141 | 1965 | Graduation | Together | 71613.0 | 0 | 0 | 2013-08-21 | 26 | 426 | ... | 4 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 11 | 0 |
3 | 6182 | 1984 | Graduation | Together | 26646.0 | 1 | 0 | 2014-02-10 | 26 | 11 | ... | 6 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 11 | 0 |
4 | 5324 | 1981 | PhD | Married | 58293.0 | 1 | 0 | 2014-01-19 | 94 | 173 | ... | 5 | 0 | 0 | 0 | 0 | 0 | 0 | 3 | 11 | 0 |
5 rows × 29 columns
Exercício 3#
Objetivo: aplicar o Teorema de Bayes em uma situação de medida laboratorial
Ao testar um sistema de visão computacional para acesso de segurança, foram encontrados os seguintes números:
A probabilidade do sistema aceitar como segura uma imagem que, de fato, é de um usuário autorizado (\(P(+ | s)\)) é de \(0.90\),
A probabilidade do sistema aceitar erroneamente uma imagem que não é de um usuário autorizado (\(P(+ | \bar{s})\)) é de \(0.01\).
Tipicamente, 70% das tentativas de acesso são legítimas, isto é, \(P(s)=0.7\).
Se o sistema apontou que um acesso é legítimo, qual é a probabilidade de que ele seja de fato legítimo, isto é, calcule \(P(s | +)\).
Para este exercício, veja este vídeo, e depois este outro.
Exercício 4#
Objetivo: usar o Teorema de Bayes para fazer um processo de classificação
O rock é um estilo musical marcado por guitarras distorcidas. Poderíamos estimar que 90% das músicas de rock têm guitarras distorcidas. Porém, as guitarras distorcidas também aparecem no axé: 20% das músicas de axé têm guitarras distorcidas. Ao todo, as guitarras distorcidas aparecem em 70% do conjunto total de músicas de rock e axé.
Durante o carnaval, 90% das músicas que tocam no rádio são axé, e somente 10% são de rock. Se uma música tem guitarras distorcidas, qual é a probabilidade de se tratar de rock? Qual é a probabilidade de se tratar de axé? Qual é a escolha mais provavelmente correta?
Em uma viagem a Seattle, 70% das músicas que tocam na rádio são rock, ao passo que 30% são axé (desde a grande invasão tropical). Se ouço uma música com guitarras distorcidas, qual é a probabilidade de se tratar de rock? Qual é a probabilidade de se tratar de axé? Qual é a escolha mais provavelmente correta?