Puntuación:
Actualmente no hay opiniones de lectores. La calificación se basa en 3 votos.
Data Cleaning
La calidad de los datos es uno de los problemas más importantes en la gestión de datos, ya que los datos sucios suelen dar lugar a resultados inexactos en el análisis de datos y a decisiones empresariales incorrectas.
Según los informes, los datos deficientes en las empresas y el gobierno de EE. UU. cuestan billones de dólares al año. Múltiples encuestas muestran que los datos sucios son la barrera más común a la que se enfrentan los científicos de datos. No es de extrañar que el desarrollo de soluciones eficaces y eficientes de limpieza de datos sea todo un reto y esté plagado de profundos problemas teóricos y de ingeniería.
Este libro trata de la limpieza de datos, que se utiliza para referirse a todo tipo de tareas y actividades destinadas a detectar y reparar errores en los datos. En lugar de centrarnos en una tarea concreta de limpieza de datos, ofrecemos una visión general del proceso de limpieza de datos de principio a fin, describiendo diversos métodos de detección y reparación de errores, e intentamos anclar estas propuestas con múltiples taxonomías y puntos de vista. En concreto, cubrimos cuatro de las tareas de limpieza de datos más comunes e importantes, a saber, la detección de valores atípicos, la transformación de datos, la reparación de errores (incluida la imputación de valores perdidos) y la deduplicación de datos. Además, debido a la creciente popularidad y aplicabilidad de las técnicas de aprendizaje automático, incluimos un capítulo que explora específicamente cómo se utilizan las técnicas de aprendizaje automático para la limpieza de datos, y cómo se utiliza la limpieza de datos para mejorar los modelos de aprendizaje automático.
Este libro pretende servir de referencia útil para investigadores y profesionales interesados en el ámbito de la calidad y la limpieza de datos. También puede utilizarse como libro de texto en un curso de posgrado. Aunque nuestro objetivo es cubrir los algoritmos y técnicas más avanzados, reconocemos que la limpieza de datos sigue siendo un campo de investigación activo y, por lo tanto, proporcionamos futuras direcciones de investigación siempre que sea apropiado.
© Book1 Group - todos los derechos reservados.
El contenido de este sitio no se puede copiar o usar, ni en parte ni en su totalidad, sin el permiso escrito del propietario.
Última modificación: 2024.11.14 07:32 (GMT)