Aprendizagem por Reforço
Aprendizagem por Reforço. Algoritmos de Aprendizagem por Reforço. Implementação de agentes autônomos usando aprendizagem por reforço.
Ao final da disciplina o estudante será capaz de:
- Construir um sistema baseado em aprendizagem por reforço para tomada de decisões sequenciais.
- Compreender como se deve formalizar uma tarefa considerando um problema de aprendizagem por reforço, como implementar uma solução e avaliá-la.
- Compreender os tipos de algoritmos de aprendizagem por reforço: value-based, policy gradient e actor-critic.
- Compreender qual é a relação de aprendizagem por reforço com aprendizagem supervisionada e não-supervisionada. supervised learning.
Conteúdo Programático
- Introdução ao Aprendizado por Reforço.
- Implementação de agentes autônomos usando aprendizagem por reforço.
- Taxonomia dos algoritmos de aprendizagem por reforço.
- Algoritmo Q-Learning.
- Algoritmo Sarsa.
- Deep Reinforcement Learning.
- Algoritmos do tipo Deep Q-Learning.
- Reinforce: um algoritmo de Policy Gradient.
- Algoritmos do tipo Actor-Critic.
- Implementações de agentes autônomos usando projetos, tais como, Gymnasium da Farama e a biblioteca para reinforcement learning do Kaggle.
- Exemplos de soluções usando aprendizagem por reforço.
Bibliografia Básica
Bibliografia Complementar
