Limpieza de datos

Limpieza de datos (F. Ilyas Ihab)

Título original:

Data Cleaning

Contenido del libro:

La calidad de los datos es uno de los problemas más importantes en la gestión de datos, ya que los datos sucios suelen dar lugar a resultados inexactos en el análisis de datos y a decisiones empresariales incorrectas.

Según los informes, los datos deficientes en las empresas y el gobierno de EE. UU. cuestan billones de dólares al año. Múltiples encuestas muestran que los datos sucios son la barrera más común a la que se enfrentan los científicos de datos. No es de extrañar que el desarrollo de soluciones eficaces y eficientes de limpieza de datos sea todo un reto y esté plagado de profundos problemas teóricos y de ingeniería.

Este libro trata de la limpieza de datos, que se utiliza para referirse a todo tipo de tareas y actividades destinadas a detectar y reparar errores en los datos. En lugar de centrarnos en una tarea concreta de limpieza de datos, ofrecemos una visión general del proceso de limpieza de datos de principio a fin, describiendo diversos métodos de detección y reparación de errores, e intentamos anclar estas propuestas con múltiples taxonomías y puntos de vista. En concreto, cubrimos cuatro de las tareas de limpieza de datos más comunes e importantes, a saber, la detección de valores atípicos, la transformación de datos, la reparación de errores (incluida la imputación de valores perdidos) y la deduplicación de datos. Además, debido a la creciente popularidad y aplicabilidad de las técnicas de aprendizaje automático, incluimos un capítulo que explora específicamente cómo se utilizan las técnicas de aprendizaje automático para la limpieza de datos, y cómo se utiliza la limpieza de datos para mejorar los modelos de aprendizaje automático.

Este libro pretende servir de referencia útil para investigadores y profesionales interesados en el ámbito de la calidad y la limpieza de datos. También puede utilizarse como libro de texto en un curso de posgrado. Aunque nuestro objetivo es cubrir los algoritmos y técnicas más avanzados, reconocemos que la limpieza de datos sigue siendo un campo de investigación activo y, por lo tanto, proporcionamos futuras direcciones de investigación siempre que sea apropiado.

Otros datos del libro:

ISBN:9781450371537
Autor:
Editorial:
Encuadernación:Tapa blanda

Compra:

Actualmente disponible, en stock.

¡Lo compro!

Otros libros del autor:

Limpieza de datos - Data Cleaning
La calidad de los datos es uno de los problemas más importantes en la gestión de datos, ya que los datos sucios suelen dar lugar a resultados...
Limpieza de datos - Data Cleaning

Las obras del autor han sido publicadas por las siguientes editoriales:

© Book1 Group - todos los derechos reservados.
El contenido de este sitio no se puede copiar o usar, ni en parte ni en su totalidad, sin el permiso escrito del propietario.
Última modificación: 2024.10.17 08:50 (GMT+2)