Ir para o conteúdo

2026.2

Instrutor

Humberto Sandmann humbertors@insper.edu.br

Horário

Aula - -h00 -h00
Aula - -h00 -h00
Atendimento - -h00 -h30

Nota Final

\[ \text{Final} = \left\{\begin{array}{lll} \text{Individual} \geq 5 \bigwedge \text{Equipe} \geq 5 & \implies & \displaystyle \frac{ \text{Individual} + \text{Equipe} } {2} \\ \\ \text{Caso contrário} & \implies & \min\left(\text{Individual}, \text{Equipe}\right) \end{array}\right. \]

Ementa 2026.2

Módulo 1
Fundamentos
  • Conceitos e IA
  • Dados
  • Pré-processamento
  • Redes Neurais
  • Perceptron
  • MLP
  • Otimização
  • Regularização
  • Métricas
Módulo 2
Arquiteturas Profundas
  • Camadas de AP
  • CNNs
  • Atenção NOVO
  • Transformers NOVO
  • Transfer Learning NOVO
  • LLMs NOVO
Módulo 3
Modelos Generativos
  • Visão Geral
  • VAE
  • GAN
  • CLIP
  • Stable Diffusion
  • Flow Matching
  • Transformers de Difusão NOVO
  • Geração Autorregressiva NOVO

Descrição do Curso

Este curso fornece uma introdução abrangente às Redes Neurais Artificiais e ao Aprendizado Profundo, usando frameworks modernos (principalmente PyTorch). Os tópicos abrangem fundamentos matemáticos, arquiteturas principais (MLPs, CNNs, Transformers), mecanismos de atenção, modelos generativos (GANs, VAEs, Difusão, Flow Matching), Transformers de Difusão e Grandes Modelos de Linguagem. É dada ênfase igual à compreensão teórica e à aplicação prática.

Objetivos de Aprendizagem

Ao final deste curso, os alunos serão capazes de:

  1. Entender os Fundamentos: explicar gradiente descendente, retropropagação, funções de ativação e regularização.
  2. Dominar Arquiteturas Principais: descrever e motivar MLPs, CNNs, Transformers e LLMs.
  3. Implementar com PyTorch: treinar e depurar modelos de aprendizado profundo.
  4. Avaliar o Desempenho: aplicar métricas apropriadas e técnicas de regularização/otimização.
  5. Trabalhar com Modelos Generativos: entender e aplicar GANs, VAEs, Difusão e Flow Matching.
  6. Aplicar Transfer Learning: fazer fine-tuning de modelos pré-treinados usando técnicas PEFT (LoRA, QLoRA).
  7. Entender LLMs: compreender arquitetura, treinamento (RLHF, DPO) e aplicações de Grandes Modelos de Linguagem.
  8. Avaliar Pesquisas Criticamente: ler e avaliar artigos atuais de aprendizado profundo.

Bibliografia

Principal:

  1. Fleuret, F. (2023). The Little Book of Deep Learning.
  2. Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep Learning. MIT Press.

Complementar:

  1. Nielsen, M. A. (2019). Neural Networks and Deep Learning.
  2. Zhang, A. et al. (2024). Dive into Deep Learning.
  3. Vaswani, A. et al. (2017). Attention Is All You Need.
  4. Brown, T. et al. (2020). Language Models are Few-Shot Learners.