Skip to content

Apresentação da disciplina

Como esta disciplina irá funcionar?

  1. Objetivos de aprendizado
  2. Esta é uma disciplina mão na massa!
  3. Requisitos
  4. Conteúdo
  5. Avaliação

Introdução ao Aprendizado por Reforço

  1. Definição e conceitos-chave
  2. Diferenças com outras técnicas de aprendizado de máquina
  3. Exemplos de aplicações do mundo real

Atividades

  1. Leia esta seção no site da OpenAI, as seções 1 e 2 do artigo Reward is enough e responda as questões abaixo:

    1. Qual é a definição de agente (agent) e ambiente (environment)?
    2. Quais são as principais dimensões do ambiente?
    3. O que é um estado (state)?
    4. O que é um espaço de ações (action space)?
    5. O que é uma política (policy)?

Responda as questões acima e envie o documento via Blackboard. Prazo: 06/02/2024 às 23:30.


Last update: February 5, 2024