Skip to content

Plano de aula

O plano de aula desta disciplina está divido em cinco (5) blocos. Para cada bloco as seguintes atividades estão planejadas.

Atenção!

O programa está sempre sujeito a alterações e adaptações conforme as disciplina é executada.

Introdução sobre Aprendizagem por Reforço e Revisão sobre Agentes Autônomos

Data Conteúdo Programação/Atividade
05-Fev Apresentação da disciplina e Introdução à Aprendizagem por Reforço Aula expositiva com debate e resolução de exercícios
07-Fev Agente Autônomo e Busca em Espaço de Estados Aula expositiva com roteiro de implementação.
12-Fev Carnaval Carnaval
14-Fev Carnaval Carnaval
19-Fev Busca em Espaço de Estados e Teoria de Jogos Apresentação do problema e implementação da solução em grupo.
21-Fev Busca em Espaço de Estados e Teoria de Jogos Implementação da solução para um problema de busca competitiva e discussão dos resultados.

Algoritmos Tabulares (Q-Learning e Sarsa)

Data Conteúdo Programação/Atividade
26-Fev Algoritmo Q-Learning Aula expositiva com roteiro de implementação.
28-Fev Algoritmo Q-Learning, ferramentas para Reinforcement Learning e Environments. Aula expositiva com roteiro de implementação.
4-Março Algoritmo SARSA Aula expositiva com roteiro de implementação.
6-Março Como avaliar a performance de um agente e sua curva de aprendizado Aula expositiva com roteiro de implementação.
11-Março Usando RL em ambiente não-determinísticos Apresentação do problema e implementação da solução em grupo.
13-Março Revisão: Q-Learning, SARSA, ambientes determinísticos ou não, avaliação de agentes Debate em sala de aula sobre resultados alcançados até então com as implementações realizadas.

Deep Reinforcement Learning: value-based e policy gradient

Data Conteúdo Programação/Atividade
18-Março Implementando um agente que precisa lidar com um ambiente mais complexo Apresentação do problema e implementação da solução em grupo.
20-Março Deep Q-Learning Aula expositiva com roteiro de implementação.
25-Março Revisão sobre Redes Neurais e decisões de projeto de RN para RL Aula expositiva com roteiro de implementação.
27-Março Revisão sobre Redes Neurais e decisões de projeto de RN para RL Aula expositiva com roteiro de implementação.
1-Abril Avaliação Intermediária - implementação do projeto 1 Avaliação Intermediária - implementação do projeto 1
3-Abril Avaliação Intermediária - implementação do projeto 1 Avaliação Intermediária - implementação do projeto 1
8-Abril Algoritmo Reinforce Aula expositiva com roteiro de implementação.
10-Abril Comparando Deep Q-Learning e Reinforce Aula expositiva com roteiro de implementação.

Deep Reinforcement Learning: actor-critic

Data Conteúdo Programação/Atividade
15-Abril Deep Deterministic Policy Gradient (DDPG) Aula expositiva com roteiro de implementação.
17-Abril Deep Deterministic Policy Gradient (DDPG) Aula expositiva com roteiro de implementação.
22-Abril Policy Optimization Algorithms (PPO) Aula expositiva com roteiro de implementação.
24-Abril Policy Optimization Algorithms (PPO) Aula expositiva com roteiro de implementação.
29-Abril Reutilizando implementações de DDPG e PPO em projetos Aula expositiva com roteiro de implementação.
01-Maio Feriado Feriado

Projeto Final

Data Conteúdo Programação/Atividade
6-Maio Aula Studio Aula Studio para execução do projeto final
8-Maio Aula Studio Entrega do título do projeto e da descrição do ambiente (environment)
13-Maio Aula Studio Aula Studio para execução do projeto final
15-Maio Aula Studio Entrega da descrição dos métodos e resultados
20-Maio Aula Studio Finalização do texto e da apresentação (introdução, objetivos, ambiente, método, resultados e considerações finais)
22-Maio Apresentações Apresentações dos projetos
27-Maio Sem aula Sem aula
29-Maio Avaliação Avaliação Final


Last update: February 2, 2024