Skip to content

Capstone Project

O principal objetivo desta atividade é exercitar os conceitos vistos ao longo do semestre. Este exercício pode ser feito de diversas maneiras:

  • o grupo de alunos pode escolher um problema, de algum setor qualquer, e aplicar as técnicas de reinforcement learning vistas ao longo deste curso para resolver este problema;
  • o grupo de alunos pode aprofundar os seus conhecimentos sobre uma técnica específica de reinforcement learning através da implementação de um algoritmo específico e compará-lo com outros já conhecidos;
  • o grupo de alunos pode criar novos environments que respeitam os padrões da https://farama.org/projects.

Para alcançar este objetivo, o grupo deverá:

  • Definição da área/problema a ser tratado: 24/03/2026
  • Definição do escopo do projeto
  • Definição do MDP
  • Implementação do agente e ambiente
  • Coleta e Análise dos resultados
  • Entrega do relatório final
  • Apresentação final dos resultados do projeto

Os itens acima serão entregues ao longo do semestre, e cada um deles terá uma data de entrega específica. A definição do objetivo do trabalho deve acontecer até o dia 24/03/2026. Ao longo do semestre, as datas das demais entregas serão definidas e divulgadas.

Submissão dos artefatos produzidos

Todos os artefatos produzidos ao longo do projeto deverão ser submitidos via Github Classroom. O link para submissão é https://classroom.github.com/a/UmMHJ_-K.

Formato das equipes

O projeto deve ser desenvolvido em equipes de até 3 alunos.

Sugestão de temas

Sugestão de ambientes a serem utilizados