Plano de aula
O plano de aula desta disciplina está divido em cinco (5) blocos. Para cada bloco as seguintes atividades estão planejadas.
Atenção!
O programa está sempre sujeito a alterações e adaptações conforme as disciplina é executada.
Introdução sobre Aprendizagem por Reforço e Revisão sobre Agentes Autônomos
Data |
Conteúdo |
Programação/Atividade |
05-Fev |
Apresentação da disciplina e Introdução à Aprendizagem por Reforço |
Aula expositiva com debate e resolução de exercícios |
07-Fev |
Agente Autônomo e Busca em Espaço de Estados |
Aula expositiva com roteiro de implementação. |
12-Fev |
Carnaval |
Carnaval |
14-Fev |
Carnaval |
Carnaval |
19-Fev |
Busca em Espaço de Estados e Teoria de Jogos |
Apresentação do problema e implementação da solução em grupo. |
21-Fev |
Busca em Espaço de Estados e Teoria de Jogos |
Implementação da solução para um problema de busca competitiva e discussão dos resultados. |
Algoritmos Tabulares (Q-Learning e Sarsa)
Data |
Conteúdo |
Programação/Atividade |
26-Fev |
Algoritmo Q-Learning |
Aula expositiva com roteiro de implementação. |
28-Fev |
Algoritmo Q-Learning, ferramentas para Reinforcement Learning e Environments. |
Aula expositiva com roteiro de implementação. |
4-Março |
Algoritmo SARSA |
Aula expositiva com roteiro de implementação. |
6-Março |
Como avaliar a performance de um agente e sua curva de aprendizado |
Aula expositiva com roteiro de implementação. |
11-Março |
Usando RL em ambiente não-determinísticos |
Apresentação do problema e implementação da solução em grupo. |
13-Março |
Revisão: Q-Learning, SARSA, ambientes determinísticos ou não, avaliação de agentes |
Debate em sala de aula sobre resultados alcançados até então com as implementações realizadas. |
Deep Reinforcement Learning: value-based e policy gradient
Data |
Conteúdo |
Programação/Atividade |
18-Março |
Implementando um agente que precisa lidar com um ambiente mais complexo |
Apresentação do problema e implementação da solução em grupo. |
20-Março |
Deep Q-Learning |
Aula expositiva com roteiro de implementação. |
25-Março |
Revisão sobre Redes Neurais e decisões de projeto de RN para RL |
Aula expositiva com roteiro de implementação. |
27-Março |
Revisão sobre Redes Neurais e decisões de projeto de RN para RL |
Aula expositiva com roteiro de implementação. |
1-Abril |
Avaliação Intermediária - implementação do projeto 1 |
Avaliação Intermediária - implementação do projeto 1 |
3-Abril |
Avaliação Intermediária - implementação do projeto 1 |
Avaliação Intermediária - implementação do projeto 1 |
8-Abril |
Algoritmo Reinforce |
Aula expositiva com roteiro de implementação. |
10-Abril |
Comparando Deep Q-Learning e Reinforce |
Aula expositiva com roteiro de implementação. |
Deep Reinforcement Learning: actor-critic
Data |
Conteúdo |
Programação/Atividade |
15-Abril |
Deep Deterministic Policy Gradient (DDPG) |
Aula expositiva com roteiro de implementação. |
17-Abril |
Deep Deterministic Policy Gradient (DDPG) |
Aula expositiva com roteiro de implementação. |
22-Abril |
Policy Optimization Algorithms (PPO) |
Aula expositiva com roteiro de implementação. |
24-Abril |
Policy Optimization Algorithms (PPO) |
Aula expositiva com roteiro de implementação. |
29-Abril |
Reutilizando implementações de DDPG e PPO em projetos |
Aula expositiva com roteiro de implementação. |
01-Maio |
Feriado |
Feriado |
Projeto Final
Data |
Conteúdo |
Programação/Atividade |
6-Maio |
Aula Studio |
Aula Studio para execução do projeto final |
8-Maio |
Aula Studio |
Entrega do título do projeto e da descrição do ambiente (environment) |
13-Maio |
Aula Studio |
Aula Studio para execução do projeto final |
15-Maio |
Aula Studio |
Entrega da descrição dos métodos e resultados |
20-Maio |
Aula Studio |
Finalização do texto e da apresentação (introdução, objetivos, ambiente, método, resultados e considerações finais) |
22-Maio |
Apresentações |
Apresentações dos projetos |
27-Maio |
Sem aula |
Sem aula |
29-Maio |
Avaliação |
Avaliação Final |
Last update:
February 2, 2024