Puntuación:
En general, el libro se considera un excelente recurso para la limpieza de datos con Python, ya que ofrece consejos prácticos, explicaciones claras y numerosos ejemplos de codificación. Aunque sirve tanto de introducción exhaustiva para principiantes como de referencia útil para científicos de datos experimentados, algunos revisores señalaron áreas de mejora, en particular en el formato del código y la inclusión de gráficos.
Ventajas:El libro es muy práctico, con explicaciones claras y estructuradas, numerosos ejemplos y una gran cantidad de técnicas de limpieza, manipulación y visualización de datos. Constituye un excelente manual para quienes se inician en la ciencia de datos o la IA, y se valora especialmente por sus ideas, organización y facilidad de uso como guía de referencia rápida. Los revisores apreciaron el énfasis en la comprensión del razonamiento que subyace a las tareas de procesamiento de datos, lo que mejora el aprendizaje.
Desventajas:Algunos revisores señalaron problemas como los ejemplos de código mal formateados y difíciles de leer, el uso mínimo de gráficos, contrario al típico análisis exploratorio de datos, y la necesidad de temas más complejos, como la limpieza de datos de series temporales. Unos pocos señalaron que, aunque sirve como punto de partida sólido, puede que no cubra en profundidad todos los temas avanzados.
(basado en 28 opiniones de lectores)
Python Data Cleaning Cookbook: Modern techniques and Python tools to detect and remove dirty data and extract key insights
Descubra cómo describir sus datos en detalle, identificar problemas de datos y averiguar cómo resolverlos utilizando técnicas de uso común y consejos y trucos.
Características principales
⬤ Familiarícese con varias técnicas de limpieza de datos para revelar información clave.
⬤ Manipular datos de diferentes complejidades para darles la forma adecuada según las necesidades de su negocio.
⬤ Limpie, supervise y valide grandes volúmenes de datos para diagnosticar problemas antes de pasar al análisis de datos.
Descripción del libro
Conseguir datos limpios para revelar conocimientos es esencial, ya que lanzarse directamente al análisis de datos sin una limpieza de datos adecuada puede conducir a resultados incorrectos. Este libro le muestra herramientas y técnicas que puede aplicar para limpiar y manejar datos con Python. Comenzará familiarizándose con la forma de los datos mediante prácticas que pueden implementarse de forma rutinaria con la mayoría de las fuentes de datos. A continuación, el libro te enseña a manipular los datos para darles una forma útil. También aprenderá a filtrar y resumir los datos para obtener información y comprender mejor lo que tiene sentido y lo que no, además de descubrir cómo operar con los datos para abordar los problemas que haya identificado. A continuación, realizará tareas clave, como la gestión de valores que faltan, la validación de errores, la eliminación de datos duplicados, la supervisión de grandes volúmenes de datos y la gestión de valores atípicos y fechas no válidas. A continuación, cubrirá recetas sobre el uso del aprendizaje supervisado y el análisis de Naive Bayes para identificar valores inesperados y errores de clasificación, y generará visualizaciones para el análisis exploratorio de datos (EDA) para visualizar valores inesperados. Por último, construirá funciones y clases que podrá reutilizar sin modificaciones cuando tenga nuevos datos.
Al final de este libro de Python, estarás equipado con todas las habilidades clave que necesitas para limpiar datos y diagnosticar problemas en ellos.
Lo que aprenderás
⬤ Averiguar cómo leer y analizar datos de una variedad de fuentes.
⬤ Producir resúmenes de los atributos de los marcos de datos, columnas y filas.
⬤ Filtrar datos y seleccionar columnas de interés que satisfagan criterios dados.
⬤ Abordar problemas de datos desordenados, incluyendo el trabajo con fechas y valores faltantes.
⬤ Mejorar su productividad en Python pandas mediante el uso de encadenamiento de métodos.
⬤ Utilizar visualizaciones para obtener información adicional e identificar posibles problemas de datos.
⬤ Mejorar su capacidad para aprender lo que está pasando en sus datos.
⬤ Construir funciones y clases definidas por el usuario para automatizar la limpieza de datos.
Para quién es este libro
Este libro es para cualquiera que busque formas de manejar datos desordenados, duplicados y pobres utilizando diferentes herramientas y técnicas de Python. El libro adopta un enfoque basado en recetas para ayudarle a aprender a limpiar y gestionar datos. Para sacar el máximo partido de este libro, basta con tener conocimientos básicos de programación en Python.
© Book1 Group - todos los derechos reservados.
El contenido de este sitio no se puede copiar o usar, ni en parte ni en su totalidad, sin el permiso escrito del propietario.
Última modificación: 2024.11.14 07:32 (GMT)