Ciencia de datos con Python y Dask

Ciencia de Datos con Python y Dask (Jesse Daniel)

Opiniones de los lectores

Resumen:

El libro sirve como introducción a Dask y sus capacidades, pero tiene críticas mixtas en cuanto a su público objetivo y la profundidad de la información. Aunque ofrece una buena visión general y comparaciones con Pandas, a menudo profundiza en conceptos elementales que pueden no ser relevantes para los lectores a los que va dirigido.

Ventajas:

⬤ Buena introducción para principiantes
⬤ explicaciones sólidas de las estructuras de datos de Dask
⬤ comparación efectiva con Pandas
⬤ recurso valioso para entender conceptos de ciencia de datos
⬤ sintaxis y casos de uso claros.

Desventajas:

⬤ Demasiado básico para usuarios intermedios
⬤ incluye conceptos elementales irrelevantes
⬤ el diseño y la estructura podrían mejorarse
⬤ se observan algunos problemas técnicos
⬤ el contenido puede ser demasiado detallado para el público al que va dirigido.

(basado en 6 opiniones de lectores)

Título original:

Data Science with Python and Dask

Contenido del libro:

Resumen

Dask es una herramienta nativa de análisis paralelo diseñada para integrarse perfectamente con las bibliotecas que ya está utilizando, incluyendo Pandas, NumPy, y Scikit-Learn. Con Dask puedes trabajar con grandes conjuntos de datos utilizando las herramientas que ya tienes. Y Data Science with Python and Dask es su guía para utilizar Dask en sus proyectos de datos sin cambiar su forma de trabajar.

La compra del libro impreso incluye un libro electrónico gratuito en formatos PDF, Kindle y ePub de Manning Publications. Encontrará las instrucciones de registro en el interior del libro impreso.

Acerca de la tecnología

Una canalización de datos eficiente lo es todo para el éxito de un proyecto de ciencia de datos. Dask es una biblioteca flexible para la computación paralela en Python que facilita la construcción de flujos de trabajo intuitivos para la ingesta y el análisis de grandes conjuntos de datos distribuidos. Dask proporciona programación dinámica de tareas y colecciones paralelas que amplían la funcionalidad de NumPy, Pandas y Scikit-learn, permitiendo a los usuarios escalar su código desde un único ordenador portátil a un clúster de cientos de máquinas con facilidad.

Acerca del libro

Data Science with Python and Dask te enseña a construir proyectos escalables que pueden manejar conjuntos de datos masivos. Después de conocer el framework Dask, analizarás datos en la base de datos NYC Parking Ticket y utilizarás DataFrames para agilizar tu proceso. A continuación, crearás modelos de aprendizaje automático utilizando Dask-ML, crearás visualizaciones interactivas y construirás clústeres utilizando AWS y Docker.

Contenido

⬤ Trabajando con grandes conjuntos de datos estructurados y no estructurados.

⬤ Visualización con Seaborn y Datashader.

⬤ Implementación de tus propios algoritmos.

⬤ Construyendo aplicaciones distribuidas con Dask Distributed.

⬤ Empaquetado y despliegue de aplicaciones Dask.

Sobre el lector

Para científicos de datos y desarrolladores con experiencia usando Python y la pila PyData.

Sobre el autor

Jesse Daniel es un experimentado desarrollador de Python. Enseñó Python para Ciencia de Datos en la Universidad de Denver y dirige un equipo de científicos de datos en una empresa de tecnología de medios de comunicación con sede en Denver.

Índice

PARTE 1 - Los bloques de construcción de la computación escalable.

⬤ Por qué es importante la computación escalable.

⬤ Introducción a Dask.

PARTE 2 - Trabajando con Datos Estructurados usando Dask DataFrames.

⬤ Introducción a Dask DataFrames.

⬤ Carga de datos en DataFrames.

⬤ Limpieza y transformación de DataFrames.

⬤ Resumir y analizar DataFrames.

⬤ Visualización de DataFrames con Seaborn.

⬤ Visualización de datos de localización con Datashader.

PARTE 3 - Extendiendo y desplegando Dask.

⬤ Trabajando con Bags y Arrays.

⬤ Aprendizaje automático con Dask-ML.

⬤ Escalado y despliegue de Dask.

Otros datos del libro:

ISBN:	9781617295607
Autor:	Jesse Daniel
Editorial:	Manning Pubn
Encuadernación:	Tapa blanda
Año de publicación:	2019
Número de páginas:	296

Compra:

Actualmente disponible, en stock.

Opiniones de los lectores

Título original:

Contenido del libro:

Otros datos del libro:

Compra:

Otros libros del autor:

Las obras del autor han sido publicadas por las siguientes editoriales: