Supervised Machine Learning: Optimization Framework and Applications with SAS and R
Marco de IA destinado a resolver un problema de compensación entre sesgo y varianza para métodos de aprendizaje supervisado en aplicaciones de la vida real. El marco de IA se compone de bootstrapping para crear múltiples conjuntos de datos de entrenamiento y prueba con diversas características, diseño y análisis de experimentos estadísticos para identificar subconjuntos óptimos de características e hiperparámetros óptimos para métodos de ML, contaminación de datos para probar la robustez de los clasificadores.
Características principales:
⬤ El uso de métodos ML por sí mismo no garantiza la construcción de clasificadores que generalicen bien para nuevos datos.
⬤ La identificación de subconjuntos óptimos de características e hiperparámetros de los métodos ML puede resolverse mediante el diseño y análisis de experimentos estadísticos.
⬤ El uso de un enfoque de bootstrapping para el muestreo masivo de conjuntos de datos de entrenamiento y pruebas con diversas características de datos (por ejemplo, conjuntos de entrenamiento contaminados) permite hacer frente al sesgo.
⬤ El desarrollo de un entorno basado en tablas SAS permite gestionar todos los metadatos relacionados con el marco de IA propuesto y crear interoperabilidad con las bibliotecas R para llevar a cabo diversas tareas estadísticas y de aprendizaje automático.
⬤ Los programas informáticos en R y SAS que crean el marco de IA están disponibles en GitHub.
© Book1 Group - todos los derechos reservados.
El contenido de este sitio no se puede copiar o usar, ni en parte ni en su totalidad, sin el permiso escrito del propietario.
Última modificación: 2024.11.14 07:32 (GMT)