Aprendizaje en videojuegos
En esta PEC trabajamos con los conceptos relacionados con aprendizaje que se han visto en la teoría, especialmente con el aprendizaje por refuerzo. Uso de Tabla Q.
El juego consiste en conseguir que el jugador (cilindro azul), partiendo de la casilla S, llegue a la salida del laberinto, casilla E. El jugador puede:
⦁ Moverse en las 4 direcciones cardinales, es decir no puede moverse
en diagonal
⦁ Caminar por las casillas libres
⦁ Destruir las casillas de ladrillo, que entonces se convierten en casillas libres
⦁ Las casillas de piedra no se pueden destruir ni se puede caminar sobre ellas
El agente solo puede realizar cuatro acciones: moverse hacia la izquierda,hacia la derecha, hacia arriba o hacia abajo. No puede quedarse quieto.
Las posibles acciones y sus recompensas son:
⦁ Moverse a una casilla libre: -0.05
⦁ Moverse a una casilla de ladrillo (y por tanto romperla): -0.2
⦁ Intentar moverse a una casilla de piedra (no se ejecuta el movimiento, simplemente choca): -0.7
⦁ Intentar salir de los límites del tablero (tampoco se ejecuta): -0.8
⦁ Alcanzar la salida: +10
Actividad 4: Se introduce un enemigo que puede matar al agente.
Actividad 5: Se quita el enemigo y se visualiza, en cada casilla, la opción más beneficiosa para el agente, según la tabla Q.
Género:
IA
Asignatura:
Inteligencia Artificial
Fecha de desarrollo:
Curso 2020-2021. Primer semestre.