2025.2

Instructor


Humberto Sandmann	humbertors@insper.edu.br

Students

Subscription

If your name is not on the list yet, please fill out the subscription form.

Meetings


Lecture	Mon.	12h00 14h00
Lecture	Tue.	12h00 14h00
Office hours	Thu.	14h00 15h30

Grade

\[ \text{Final} = \left\{\begin{array}{lll} \text{Individual} \geq 5 \bigwedge \text{Team} \geq 5 & \implies & \displaystyle \frac{ \text{Individual} + \text{Team} } {2} \\ \\ \text{Otherwise} & \implies & \min\left(\text{Individual}, \text{Team}\right) \end{array}\right. \]

Planning

Ementa

Este curso oferece uma introdução abrangente à Redes Neurais e Deep Learning, um subcampo do aprendizado de máquina que se concentra em algoritmos chamados de redes neurais artificiais. Abordaremos os princípios fundamentais, os alicerces matemáticos, as principais arquiteturas e as técnicas de implementação prática. O curso se inspira em cursos acadêmicos de ponta e utiliza frameworks modernos de aprendizado profundo, principalmente o TensorFlow e PyTorch. Os tópicos incluem conceitos fundamentais (gradiente descendente, retropropagação), principais arquiteturas de rede (MLPs, CNNs, LSTMs, Transformers), modelos generativos (GANs) e aprendizado autossupervisionado. A ênfase será dada tanto à compreensão teórica quanto à aplicação prática em problemas do mundo real em áreas como visão computacional e processamento de linguagem natural.

Objetivos

Ao final da disciplina o aluno será capaz de:

Compreender Conceitos Fundamentais: explicar os princípios matemáticos e algorítmicos fundamentais sobre redes neurais artificiais, incluindo gradiente descendente, retropropagação, funções de ativação, funções de perda e regularização.
Dominar Arquiteturas-Chave: descrever a arquitetura e a racionalidade por trás dos principais modelos de aprendizado profundo, incluindo Perceptrons Multicamadas (MLPs), Redes Neurais Convolucionais (CNNs), Redes Neurais Recorrentes (LSTMs, GRUs) e Transformers.
Implementar Modelos de Aprendizado Profundo: implementar, treinar e depurar modelos de aprendizado profundo usando frameworks, tais como TensorFlow e PyTorch, para tarefas como classificação de imagens, modelagem de sequências e geração.
Analisar o Desempenho do Modelo: avaliar o desempenho do modelo usando métricas apropriadas, compreender armadilhas comuns (por exemplo, sobreajuste, gradientes que desaparecem/explodem) e aplicar técnicas para mitigá-las.
Explorar Tópicos Avançados: familiarizar-se com conceitos avançados, como modelos generativos (GANs), modelos baseados em energia, aprendizado autossupervisionado e mecanismos de atenção.
Avaliar Pesquisas Criticamente: ler e avaliar criticamente artigos de pesquisa atuais no campo do aprendizado profundo.
Aplicar: formular problemas do mundo real em termos adequados para soluções de aprendizado profundo e projetar modelos apropriados.

Conteúdo Programático

Introdução e Fundamentos de ML
Redes Neurais e Retropropagação
Treinamento de Redes Neurais e Regularização
Redes Neurais Convolucionais (CNNs)
Aplicações em Visão Computacional
Arquiteturas Modernas de CNNs
Aprendizado por Transferência
Modelos Recorrentes (LSTMs e GRUs)
Mecanismos de Atenção
Transformers
Modelos Generativos (GANs)
Aprendizado Autossupervisionado
Projetos Práticos e Estudos de Caso

Bibliografia Básica

Livros:

Fleuret, F. (2023). The little book of deep learning, (Continuously updated online version).
Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep learning. MIT Press.

Bibliografia Complementar

Livros:

Nielsen, M. A. (2019). Neural networks and deep learning. Determination Press.
Zhang, A., Lipton, Z. C., Li, M., & Smola, A. J. (2024). Dive into deep learning. (Continuously updated online version).