Puntuación:
Actualmente no hay opiniones de lectores. La calificación se basa en 9 votos.
Pandas for Everyone: Python Data Analysis
Introducción práctica y rica en ejemplos al análisis de datos con Pandas en Python.
Hoy en día, los analistas deben gestionar datos caracterizados por una variedad, velocidad y volumen extraordinarios. Gracias a la biblioteca de código abierto Pandas, puede utilizar Python para automatizar y realizar rápidamente prácticamente cualquier tarea de análisis de datos, por grande o compleja que sea. Pandas puede ayudarle a garantizar la veracidad de sus datos, visualizarlos para tomar decisiones eficaces y reproducir análisis de forma fiable en múltiples conjuntos de datos.
Pandas para todos reúne conocimientos prácticos y perspectivas para resolver problemas reales con Pandas, incluso si es nuevo en el análisis de datos con Python. Daniel Y. Chen introduce conceptos clave a través de ejemplos sencillos pero prácticos, y los amplía progresivamente para resolver problemas más difíciles del mundo real.
Chen le da un salto inicial en el uso de Pandas con un conjunto de datos realista y cubre la combinación de conjuntos de datos, el manejo de los datos que faltan, y la estructuración de conjuntos de datos para facilitar el análisis y la visualización. Demuestra poderosas técnicas de limpieza de datos, desde la manipulación básica de cadenas hasta la aplicación simultánea de funciones a través de marcos de datos.
Una vez que sus datos estén listos, Chen le guiará a través del ajuste de modelos de predicción, agrupación, inferencia y exploración. Proporciona consejos sobre rendimiento y escalabilidad, y le introduce en el amplio ecosistema de análisis de datos de Python.
⬤ Trabaje con DataFrames y Series, e importe o exporte datosCree gráficos con matplotlib, seaborn y pandas.
⬤ Combinar conjuntos de datos y manejar los datos que faltan.
⬤ Reformar, ordenar y limpiar conjuntos de datos para que sea más fácil trabajar con ellos.
⬤ Convertir tipos de datos y manipular cadenas de texto.
⬤ Aplicar funciones para escalar manipulaciones de datos.
⬤ Agrupar, transformar y filtrar grandes conjuntos de datos con groupby.
⬤ Aprovechar las capacidades avanzadas de fecha y hora de Pandas.
⬤ Ajustar modelos lineales usando statsmodels y librerías scikit-learn.
⬤ Utilizar modelos lineales generalizados para ajustar modelos con diferentes variables de respuesta.
⬤ Comparar múltiples modelos para seleccionar el mejor.
⬤ Regularizar para superar el sobreajuste y mejorar el rendimiento.
⬤ Utilizar clustering en aprendizaje automático no supervisado.
⬤ .
© Book1 Group - todos los derechos reservados.
El contenido de este sitio no se puede copiar o usar, ni en parte ni en su totalidad, sin el permiso escrito del propietario.
Última modificación: 2024.11.14 07:32 (GMT)