Este aprendizado por reforço é 1 modelo de machine learning que têm a oportunidade de ser descrito tais como "aprender por". Um "agente" aprende a executar uma tarefa definida por tentativa e erro (um loop por feedback) até de que este desempenho esteja dentro por um intervalo desejável. Talvez 1 https://www.linkedin.com/feed/update/urn:li:share:7356320248985194496/?actorCompanyId=77283885