Resumo
O Aprendizado por Reforço é uma poderosa ferramenta para treinar agentes inteligentes, uma vez que o aprendizado se dá de forma totalmente autônoma. Este aprendizado é realizado por meio de repetidas interações entre agentes e o ambiente, pelo método de tentativa e erro, até o momento em que os agentes têm informação suficiente para atuar de maneira apropriada para resolver uma determinad…