Apresentação da disciplina
Como esta disciplina irá funcionar?
- Objetivos de aprendizado
- Esta é uma disciplina mão na massa!
- Requisitos
- Conteúdo
- Avaliação
Introdução ao Aprendizado por Reforço
- Definição e conceitos-chave
- Diferenças com outras técnicas de aprendizado de máquina
- Exemplos de aplicações do mundo real
Atividades
-
Leia esta seção no site da OpenAI, as seções 1 e 2 do artigo Reward is enough e responda as questões abaixo:
- Qual é a definição de agente (agent) e ambiente (environment)?
- Quais são as principais dimensões do ambiente?
- O que é um estado (state)?
- O que é um espaço de ações (action space)?
- O que é uma política (policy)?
Responda as questões acima e envie o documento via Blackboard. Prazo: 06/02/2024 às 23:30.
Last update:
February 5, 2024