Ciencia de Datos con Python y Dask

Puntuación:   (4,5 de 5)

Ciencia de Datos con Python y Dask (Jesse Daniel)

Opiniones de los lectores

Resumen:

El libro sirve como introducción a Dask y sus capacidades, pero tiene críticas mixtas en cuanto a su público objetivo y la profundidad de la información. Aunque ofrece una buena visión general y comparaciones con Pandas, a menudo profundiza en conceptos elementales que pueden no ser relevantes para los lectores a los que va dirigido.

Ventajas:

Buena introducción para principiantes
explicaciones sólidas de las estructuras de datos de Dask
comparación efectiva con Pandas
recurso valioso para entender conceptos de ciencia de datos
sintaxis y casos de uso claros.

Desventajas:

Demasiado básico para usuarios intermedios
incluye conceptos elementales irrelevantes
el diseño y la estructura podrían mejorarse
se observan algunos problemas técnicos
el contenido puede ser demasiado detallado para el público al que va dirigido.

(basado en 6 opiniones de lectores)

Título original:

Data Science with Python and Dask

Contenido del libro:

Resumen

Dask es una herramienta nativa de análisis paralelo diseñada para integrarse perfectamente con las bibliotecas que ya está utilizando, incluyendo Pandas, NumPy, y Scikit-Learn. Con Dask puedes trabajar con grandes conjuntos de datos utilizando las herramientas que ya tienes. Y Data Science with Python and Dask es su guía para utilizar Dask en sus proyectos de datos sin cambiar su forma de trabajar.

La compra del libro impreso incluye un libro electrónico gratuito en formatos PDF, Kindle y ePub de Manning Publications. Encontrará las instrucciones de registro en el interior del libro impreso.

Acerca de la tecnología

Una canalización de datos eficiente lo es todo para el éxito de un proyecto de ciencia de datos. Dask es una biblioteca flexible para la computación paralela en Python que facilita la construcción de flujos de trabajo intuitivos para la ingesta y el análisis de grandes conjuntos de datos distribuidos. Dask proporciona programación dinámica de tareas y colecciones paralelas que amplían la funcionalidad de NumPy, Pandas y Scikit-learn, permitiendo a los usuarios escalar su código desde un único ordenador portátil a un clúster de cientos de máquinas con facilidad.

Acerca del libro

Data Science with Python and Dask te enseña a construir proyectos escalables que pueden manejar conjuntos de datos masivos. Después de conocer el framework Dask, analizarás datos en la base de datos NYC Parking Ticket y utilizarás DataFrames para agilizar tu proceso. A continuación, crearás modelos de aprendizaje automático utilizando Dask-ML, crearás visualizaciones interactivas y construirás clústeres utilizando AWS y Docker.

Contenido

⬤ Trabajando con grandes conjuntos de datos estructurados y no estructurados.

⬤ Visualización con Seaborn y Datashader.

⬤ Implementación de tus propios algoritmos.

⬤ Construyendo aplicaciones distribuidas con Dask Distributed.

⬤ Empaquetado y despliegue de aplicaciones Dask.

Sobre el lector

Para científicos de datos y desarrolladores con experiencia usando Python y la pila PyData.

Sobre el autor

Jesse Daniel es un experimentado desarrollador de Python. Enseñó Python para Ciencia de Datos en la Universidad de Denver y dirige un equipo de científicos de datos en una empresa de tecnología de medios de comunicación con sede en Denver.

Índice

PARTE 1 - Los bloques de construcción de la computación escalable.

⬤ Por qué es importante la computación escalable.

⬤ Introducción a Dask.

PARTE 2 - Trabajando con Datos Estructurados usando Dask DataFrames.

⬤ Introducción a Dask DataFrames.

⬤ Carga de datos en DataFrames.

⬤ Limpieza y transformación de DataFrames.

⬤ Resumir y analizar DataFrames.

⬤ Visualización de DataFrames con Seaborn.

⬤ Visualización de datos de localización con Datashader.

PARTE 3 - Extendiendo y desplegando Dask.

⬤ Trabajando con Bags y Arrays.

⬤ Aprendizaje automático con Dask-ML.

⬤ Escalado y despliegue de Dask.

Otros datos del libro:

ISBN:9781617295607
Autor:
Editorial:
Encuadernación:Tapa blanda
Año de publicación:2019
Número de páginas:296

Compra:

Actualmente disponible, en stock.

¡Lo compro!

Otros libros del autor:

Ciencia de Datos con Python y Dask - Data Science with Python and Dask
Resumen Dask es una herramienta nativa de análisis paralelo diseñada para integrarse...
Ciencia de Datos con Python y Dask - Data Science with Python and Dask

Las obras del autor han sido publicadas por las siguientes editoriales:

© Book1 Group - todos los derechos reservados.
El contenido de este sitio no se puede copiar o usar, ni en parte ni en su totalidad, sin el permiso escrito del propietario.
Última modificación: 2024.11.14 07:32 (GMT)