Skip to content

Proximal Policy Optimization (PPO)

Segue material utilizado na parte expositiva da aula sobre o algoritmo PPO:

Proposta de atividade prática

Continuar com a implementação da APS, cujo o enunciado esta disponível aqui, utilizando o algoritmo PPO para treinar o agente.

Referências

Para a produção deste material foram utilizadas as seguintes referências: