Ementa
Ementa
Este curso oferece uma introdução abrangente à Redes Neurais e Deep Learning, um subcampo do aprendizado de máquina que se concentra em algoritmos chamados de redes neurais artificiais. Abordaremos os princípios fundamentais, os alicerces matemáticos, as principais arquiteturas e as técnicas de implementação prática. O curso se inspira em cursos acadêmicos de ponta e utiliza frameworks modernos de aprendizado profundo, principalmente o TensorFlow e PyTorch. Os tópicos incluem conceitos fundamentais (gradiente descendente, retropropagação), principais arquiteturas de rede (MLPs, CNNs, LSTMs, Transformers), modelos generativos (GANs) e aprendizado autossupervisionado. A ênfase será dada tanto à compreensão teórica quanto à aplicação prática em problemas do mundo real em áreas como visão computacional e processamento de linguagem natural.
Objetivos
Ao final da disciplina o aluno será capaz de:
- Compreender Conceitos Fundamentais: explicar os princípios matemáticos e algorítmicos fundamentais sobre redes neurais artificiais, incluindo gradiente descendente, retropropagação, funções de ativação, funções de perda e regularização.
- Dominar Arquiteturas-Chave: descrever a arquitetura e a racionalidade por trás dos principais modelos de aprendizado profundo, incluindo Perceptrons Multicamadas (MLPs), Redes Neurais Convolucionais (CNNs), Redes Neurais Recorrentes (LSTMs, GRUs) e Transformers.
- Implementar Modelos de Aprendizado Profundo: implementar, treinar e depurar modelos de aprendizado profundo usando frameworks, tais como TensorFlow e PyTorch, para tarefas como classificação de imagens, modelagem de sequências e geração.
- Analisar o Desempenho do Modelo: avaliar o desempenho do modelo usando métricas apropriadas, compreender armadilhas comuns (por exemplo, sobreajuste, gradientes que desaparecem/explodem) e aplicar técnicas para mitigá-las.
- Explorar Tópicos Avançados: familiarizar-se com conceitos avançados, como modelos generativos (GANs), modelos baseados em energia, aprendizado autossupervisionado e mecanismos de atenção.
- Avaliar Pesquisas Criticamente: ler e avaliar criticamente artigos de pesquisa atuais no campo do aprendizado profundo.
- Aplicar: formular problemas do mundo real em termos adequados para soluções de aprendizado profundo e projetar modelos apropriados.
Conteúdo Programático
- Introdução e Fundamentos de ML
- Redes Neurais e Retropropagação
- Treinamento de Redes Neurais e Regularização
- Redes Neurais Convolucionais (CNNs)
- Aplicações em Visão Computacional
- Arquiteturas Modernas de CNNs
- Aprendizado por Transferência
- Modelos Recorrentes (LSTMs e GRUs)
- Mecanismos de Atenção
- Transformers
- Modelos Generativos (GANs)
- Aprendizado Autossupervisionado
- Projetos Práticos e Estudos de Caso
Bibliografia Básica
Livros:
- Fleuret, F. (2023). The little book of deep learning, (Continuously updated online version).
- Goodfellow, I., Bengio, Y., & Courville, A. (2016). Deep learning. MIT Press.
Bibliografia Complementar
Livros:
- Nielsen, M. A. (2019). Neural networks and deep learning. Determination Press.
- Zhang, A., Lipton, Z. C., Li, M., & Smola, A. J. (2024). Dive into deep learning. (Continuously updated online version).