2026.2
Instrutor
| Humberto Sandmann | humbertors@insper.edu.br |
Horário
| Aula | - | -h00 -h00 |
| Aula | - | -h00 -h00 |
| Atendimento | - | -h00 -h30 |
Nota Final
\[ \text{Final} = \left\{\begin{array}{lll} \text{Individual} \geq 5 \bigwedge \text{Equipe} \geq 5 & \implies & \displaystyle \frac{ \text{Individual} + \text{Equipe} } {2} \\ \\ \text{Caso contrário} & \implies & \min\left(\text{Individual}, \text{Equipe}\right) \end{array}\right. \]
Ementa 2026.2
Módulo 1
Fundamentos
- Conceitos e IA
- Dados
- Pré-processamento
- Redes Neurais
- Perceptron
- MLP
- Otimização
- Regularização
- Métricas
Módulo 2
Arquiteturas Profundas
- Camadas de AP
- CNNs
- Atenção NOVO
- Transformers NOVO
- Transfer Learning NOVO
- LLMs NOVO
Módulo 3
Modelos Generativos
- Visão Geral
- VAE
- GAN
- CLIP
- Stable Diffusion
- Flow Matching
- Transformers de Difusão NOVO
- Geração Autorregressiva NOVO
Descrição do Curso
Este curso fornece uma introdução abrangente às Redes Neurais Artificiais e ao Aprendizado Profundo, usando frameworks modernos (principalmente PyTorch). Os tópicos abrangem fundamentos matemáticos, arquiteturas principais (MLPs, CNNs, Transformers), mecanismos de atenção, modelos generativos (GANs, VAEs, Difusão, Flow Matching), Transformers de Difusão e Grandes Modelos de Linguagem. É dada ênfase igual à compreensão teórica e à aplicação prática.
Objetivos de Aprendizagem
Ao final deste curso, os alunos serão capazes de:
- Entender os Fundamentos: explicar gradiente descendente, retropropagação, funções de ativação e regularização.
- Dominar Arquiteturas Principais: descrever e motivar MLPs, CNNs, Transformers e LLMs.
- Implementar com PyTorch: treinar e depurar modelos de aprendizado profundo.
- Avaliar o Desempenho: aplicar métricas apropriadas e técnicas de regularização/otimização.
- Trabalhar com Modelos Generativos: entender e aplicar GANs, VAEs, Difusão e Flow Matching.
- Aplicar Transfer Learning: fazer fine-tuning de modelos pré-treinados usando técnicas PEFT (LoRA, QLoRA).
- Entender LLMs: compreender arquitetura, treinamento (RLHF, DPO) e aplicações de Grandes Modelos de Linguagem.
- Avaliar Pesquisas Criticamente: ler e avaliar artigos atuais de aprendizado profundo.
Bibliografia
Principal:
- Fleuret, F. (2023). The Little Book of Deep Learning.
- Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press.
Complementar:
- Nielsen, M. A. (2019). Neural Networks and Deep Learning.
- Zhang, A. et al. (2024). Dive into Deep Learning.
- Vaswani, A. et al. (2017). Attention Is All You Need.
- Brown, T. et al. (2020). Language Models are Few-Shot Learners.