Puntuación:
Actualmente no hay opiniones de lectores. La calificación se basa en 2 votos.
Learning-Based Control: A Tutorial and Some Recent Results
El reciente éxito del aprendizaje por refuerzo y otros métodos afines puede atribuirse a varios factores clave. En primer lugar, se rige por señales de recompensa obtenidas a través de la interacción con el entorno. En segundo lugar, está estrechamente relacionado con el comportamiento de aprendizaje humano. En tercer lugar, tiene una sólida base matemática. No obstante, la teoría convencional del aprendizaje por refuerzo presenta algunas deficiencias, sobre todo en un entorno continuo o a la hora de considerar la estabilidad y robustez del proceso controlado.
En esta monografía, los autores se basan en el aprendizaje por refuerzo para presentar un enfoque basado en el aprendizaje para controlar sistemas dinámicos a partir de datos en tiempo real y repasan algunos avances importantes en este campo relativamente joven. De este modo, los autores desarrollan un marco para la teoría de control basada en el aprendizaje que muestra cómo aprender directamente controladores subóptimos a partir de datos de entrada-salida.
El desarrollo del control basado en el aprendizaje se enfrenta a tres retos principales. En primer lugar, es necesario generalizar los métodos recursivos existentes. En segundo lugar, como diferencia fundamental entre el control basado en el aprendizaje y el aprendizaje por refuerzo, la estabilidad y la robustez son cuestiones importantes que deben abordarse para los sistemas de ingeniería de seguridad crítica, como los coches autoconducidos. En tercer lugar, la eficiencia de los datos de los algoritmos de aprendizaje por refuerzo debe abordarse para los sistemas de ingeniería de seguridad crítica.
Esta monografía proporciona al lector un manual accesible sobre una nueva dirección en la teoría de control que aún está en pañales, a saber, la teoría de control basada en el aprendizaje, que está estrechamente vinculada a la literatura del aprendizaje por refuerzo seguro y la programación dinámica adaptativa.
© Book1 Group - todos los derechos reservados.
El contenido de este sitio no se puede copiar o usar, ni en parte ni en su totalidad, sin el permiso escrito del propietario.
Última modificación: 2024.11.14 07:32 (GMT)