Skip to content

Plano de aula

O plano de aula desta disciplina está divido em cinco (5) blocos. Para cada bloco as seguintes atividades estão planejadas.

Atenção!

O programa está sempre sujeito a alterações e adaptações conforme as disciplina é executada.

Introdução sobre Aprendizagem por Reforço e Revisão sobre Agentes Autônomos

Data Conteúdo Programação/Atividade
03-Fev Apresentação da disciplina e Introdução à Aprendizagem por Reforço Aula expositiva com debate e resolução de exercícios
05-Fev Apresentação da disciplina e Introdução à Aprendizagem por Reforço Aula expositiva com debate e resolução de exercícios

O conteúdo associado a este bloco é 1

Algoritmos Tabulares (Q-Learning e Sarsa)

Data Conteúdo Programação/Atividade
10-Fev Algoritmo Q-Learning. Ferramentas e ambientes para RL Aula expositiva com roteiro de implementação.
12-Fev Algoritmo Q-Learning, ferramentas para Reinforcement Learning e Environments. Aula expositiva com roteiro de implementação.
17-Fev Sem aula
19-Fev Algoritmo SARSA Aula expositiva com roteiro de implementação.
24-Fev Como avaliar a performance de um agente e sua curva de aprendizado Aula expositiva com roteiro de implementação.
26-Fev Usando RL em ambiente não-determinísticos Apresentação do problema e implementação da solução em grupo.
10-Março Revisão: Q-Learning, SARSA, ambientes determinísticos ou não, avaliação de agentes Debate em sala de aula sobre resultados alcançados até então com as implementações realizadas.

O conteúdo associado a este bloco é 2, 3, 4, 5, 6, 7, 8.

Deep Reinforcement Learning: value-based e policy gradient

Data Conteúdo Programação/Atividade
12-Março Implementando um agente que precisa lidar com um ambiente mais complexo Apresentação do problema e implementação da solução em grupo.
17-Março Deep Q-Learning Aula expositiva com roteiro de implementação.
19-Março Revisão sobre Redes Neurais e decisões de projeto de RN para RL Aula expositiva com roteiro de implementação.
24-Março Variantes do algoritmo Deep Q-Learning Aula expositiva com roteiro de implementação.
26-Março Revisão sobre Redes Neurais e decisões de projeto de RN para RL Aula expositiva com roteiro de implementação.
31-Março Implementação do projeto 1 Implementação do projeto 1
02-Abril Implementação do projeto 1 Implementação do projeto 1
7-Abril Algoritmo Reinforce Aula expositiva com roteiro de implementação.
9-Abril Comparando Deep Q-Learning e Reinforce Aula expositiva com roteiro de implementação.

Deep Reinforcement Learning: actor-critic

Data Conteúdo Programação/Atividade
14-Abril Deep Deterministic Policy Gradient (DDPG) Aula expositiva com roteiro de implementação.
16-Abril Deep Deterministic Policy Gradient (DDPG) Aula expositiva com roteiro de implementação.
23-Abril Policy Optimization Algorithms (PPO) Aula expositiva com roteiro de implementação.
28-Abril Policy Optimization Algorithms (PPO) Aula expositiva com roteiro de implementação.

Projeto Final

Data Conteúdo Programação/Atividade
30-Abril Reutilizando implementações de DDPG e PPO em projetos Aula expositiva com roteiro de implementação.
5-Maio Aula Studio Aula Studio para execução do projeto final
7-Maio Aula Studio Entrega do título do projeto e da descrição do ambiente (environment)
12-Maio Aula Studio Aula Studio para execução do projeto final
14-Maio Aula Studio Aula Studio para execução do projeto final
19-Maio Aula Studio Entrega da descrição dos métodos e resultados
21-Maio Apresentação final do projeto Apresentação final do projeto
26-Maio Não teremos aula Não teremos aula
28-Maio Não teremos aula Não teremos aula
2-Junho Avaliação Avaliação Final
4-Junho Avaliação Avaliação Final