Puntuación:
El libro sirve como introducción a Dask y sus capacidades, pero tiene críticas mixtas en cuanto a su público objetivo y la profundidad de la información. Aunque ofrece una buena visión general y comparaciones con Pandas, a menudo profundiza en conceptos elementales que pueden no ser relevantes para los lectores a los que va dirigido.
Ventajas:⬤ Buena introducción para principiantes
⬤ explicaciones sólidas de las estructuras de datos de Dask
⬤ comparación efectiva con Pandas
⬤ recurso valioso para entender conceptos de ciencia de datos
⬤ sintaxis y casos de uso claros.
⬤ Demasiado básico para usuarios intermedios
⬤ incluye conceptos elementales irrelevantes
⬤ el diseño y la estructura podrían mejorarse
⬤ se observan algunos problemas técnicos
⬤ el contenido puede ser demasiado detallado para el público al que va dirigido.
(basado en 6 opiniones de lectores)
Data Science with Python and Dask
Resumen
Dask es una herramienta nativa de análisis paralelo diseñada para integrarse perfectamente con las bibliotecas que ya está utilizando, incluyendo Pandas, NumPy, y Scikit-Learn. Con Dask puedes trabajar con grandes conjuntos de datos utilizando las herramientas que ya tienes. Y Data Science with Python and Dask es su guía para utilizar Dask en sus proyectos de datos sin cambiar su forma de trabajar.
La compra del libro impreso incluye un libro electrónico gratuito en formatos PDF, Kindle y ePub de Manning Publications. Encontrará las instrucciones de registro en el interior del libro impreso.
Acerca de la tecnología
Una canalización de datos eficiente lo es todo para el éxito de un proyecto de ciencia de datos. Dask es una biblioteca flexible para la computación paralela en Python que facilita la construcción de flujos de trabajo intuitivos para la ingesta y el análisis de grandes conjuntos de datos distribuidos. Dask proporciona programación dinámica de tareas y colecciones paralelas que amplían la funcionalidad de NumPy, Pandas y Scikit-learn, permitiendo a los usuarios escalar su código desde un único ordenador portátil a un clúster de cientos de máquinas con facilidad.
Acerca del libro
Data Science with Python and Dask te enseña a construir proyectos escalables que pueden manejar conjuntos de datos masivos. Después de conocer el framework Dask, analizarás datos en la base de datos NYC Parking Ticket y utilizarás DataFrames para agilizar tu proceso. A continuación, crearás modelos de aprendizaje automático utilizando Dask-ML, crearás visualizaciones interactivas y construirás clústeres utilizando AWS y Docker.
Contenido
⬤ Trabajando con grandes conjuntos de datos estructurados y no estructurados.
⬤ Visualización con Seaborn y Datashader.
⬤ Implementación de tus propios algoritmos.
⬤ Construyendo aplicaciones distribuidas con Dask Distributed.
⬤ Empaquetado y despliegue de aplicaciones Dask.
Sobre el lector
Para científicos de datos y desarrolladores con experiencia usando Python y la pila PyData.
Sobre el autor
Jesse Daniel es un experimentado desarrollador de Python. Enseñó Python para Ciencia de Datos en la Universidad de Denver y dirige un equipo de científicos de datos en una empresa de tecnología de medios de comunicación con sede en Denver.
Índice
PARTE 1 - Los bloques de construcción de la computación escalable.
⬤ Por qué es importante la computación escalable.
⬤ Introducción a Dask.
PARTE 2 - Trabajando con Datos Estructurados usando Dask DataFrames.
⬤ Introducción a Dask DataFrames.
⬤ Carga de datos en DataFrames.
⬤ Limpieza y transformación de DataFrames.
⬤ Resumir y analizar DataFrames.
⬤ Visualización de DataFrames con Seaborn.
⬤ Visualización de datos de localización con Datashader.
PARTE 3 - Extendiendo y desplegando Dask.
⬤ Trabajando con Bags y Arrays.
⬤ Aprendizaje automático con Dask-ML.
⬤ Escalado y despliegue de Dask.
© Book1 Group - todos los derechos reservados.
El contenido de este sitio no se puede copiar o usar, ni en parte ni en su totalidad, sin el permiso escrito del propietario.
Última modificación: 2024.11.14 07:32 (GMT)