9.2. Regression

Tarefas de regressão preveem valores contínuos. As seguintes métricas avaliam a acurácia dos valores previstos em relação aos valores reais:

Métrica	Propósito	Caso de Uso
Erro Absoluto Médio (MAE) \( \displaystyle \frac{1}{N} \sum_{i=1}^N \vert y_i - \hat{y}_i \vert \)	Mede a diferença absoluta média entre previsões e valores reais	Robusto a outliers, interpretável como erro médio
Erro Quadrático Médio (MSE) \( \displaystyle \frac{1}{N} \sum_{i=1}^N (y_i - \hat{y}_i)^2 \)	Mede a diferença quadrática média entre previsões e valores reais	Sensível a outliers, comumente usado em funções de perda de redes neurais
Raiz do Erro Quadrático Médio (RMSE) \( \displaystyle \sqrt{\frac{1}{N} \sum_{i=1}^N (y_i - \hat{y}_i)^2} \)	Raiz quadrada do MSE, fornecendo o erro nas mesmas unidades que o alvo	Preferido para magnitude de erro interpretável, amplamente usado em previsão
Erro Percentual Absoluto Médio (MAPE) \( \displaystyle \frac{1}{N} \sum_{i=1}^N \left \vert \frac{y_i - \hat{y}_i}{y_i} \right \vert \cdot 100 \)	Mede o erro percentual médio relativo aos valores reais	Útil quando erros relativos importam (ex: previsões financeiras), mas sensível a valores reais próximos de zero
\(R^2\) (Coeficiente de Determinação) \( \displaystyle 1 - \frac{\sum_{i=1}^N (y_i - \hat{y}_i)^2}{\sum_{i=1}^N (y_i - \bar{y})^2} \)	Mede a proporção da variância na variável dependente explicada pelo modelo	Indica o ajuste do modelo, com valores mais próximos de 1 indicando melhor ajuste
\(R^2\) Ajustado \( \displaystyle 1 - \left( \frac{(1 - R^2)(N - 1)}{N - k - 1} \right) \)	Ajusta o R² para o número de preditores, penalizando modelos excessivamente complexos	Útil ao comparar modelos com diferentes números de features
Erro Absoluto Mediano (\(\text{MedAE}\)) \( \displaystyle \text{mediana}(\vert y_1 - \hat{y}_1 \vert, \dots, \vert y_N - \hat{y}_N \vert) \)	Mede a mediana das diferenças absolutas, altamente robusto a outliers	Preferido em datasets com valores extremos ou erros não-gaussianos