Procesamiento de datos con Optimus: Potencie las tareas de preparación de big data para análisis y aprendizaje automático con Optimus utilizando Dask y PySpark

Puntuación:   (4,7 de 5)

Procesamiento de datos con Optimus: Potencie las tareas de preparación de big data para análisis y aprendizaje automático con Optimus utilizando Dask y PySpark (Argenis Leon)

Opiniones de los lectores

Resumen:

El libro es elogiado por su cobertura exhaustiva del procesamiento de datos mediante Pandas y Optimus, lo que lo convierte en un recurso valioso tanto para los recién llegados como para los profesionales de datos experimentados. Simplifica las tareas de datos complejas y mejora la eficiencia del flujo de trabajo.

Ventajas:

Proporciona una guía detallada sobre el preprocesamiento de datos con Pandas y Optimus.

Desventajas:

Excelente para aprender y acelerar el manejo y transformación de datos.

(basado en 4 opiniones de lectores)

Título original:

Data Processing with Optimus: Supercharge big data preparation tasks for analytics and machine learning with Optimus using Dask and PySpark

Contenido del libro:

Redactada por el equipo central de Optimus, esta completa guía le ayudará a comprender cómo Optimus mejora todo el panorama del procesamiento de datos.

Características principales:

⬤ Cargue, fusione y guarde datos pequeños y grandes de manera eficiente con Optimus.

⬤ Aprenda las funciones de Optimus para el análisis de datos, ingeniería de características, aprendizaje automático, validación cruzada y PNL.

⬤ Descubra cómo Optimus mejora otras tecnologías de marcos de datos y le ayuda a acelerar sus tareas de procesamiento de datos.

Descripción del libro:

Optimus es una biblioteca de Python que funciona como una API unificada para la limpieza de datos, procesamiento y fusión de datos. Se puede utilizar para manejar datos pequeños y grandes en su portátil local o en clusters remotos utilizando CPUs o GPUs.

El libro comienza cubriendo los aspectos internos de Optimus y cómo funciona en tándem con las tecnologías existentes para satisfacer sus necesidades de procesamiento de datos. A continuación, aprenderá a utilizar Optimus para cargar y guardar datos de formatos de datos de texto como archivos CSV y JSON, explorar archivos binarios como Excel, y para el procesamiento de datos en columnas con Parquet, Avro y OCR. A continuación, se familiarizará con el perfilador y sus tipos de datos - una característica única de Optimus Dataframe que ayuda a la calidad de los datos. Verá cómo utilizar los gráficos disponibles en Optimus, tales como histogramas, gráficos de frecuencia y gráficos de dispersión y de caja, y entenderá cómo Optimus le permite conectarse a bibliotecas como Plotly y Altair. También profundizará en aplicaciones avanzadas como la ingeniería de características, el aprendizaje automático, la validación cruzada y las funciones de procesamiento del lenguaje natural, y explorará los avances de Optimus. Por último, aprenderá a crear funciones de limpieza y transformación de datos y a añadir un hipotético nuevo motor de procesamiento de datos con Optimus.

Al final de este libro, usted será capaz de mejorar su flujo de trabajo de ciencia de datos con Optimus fácilmente.

Lo que aprenderá:

⬤ Utilizar más de 100 funciones de procesamiento de datos sobre columnas y otros valores tipo cadena.

⬤ Remodelar y pivotar datos para obtener la salida en el formato requerido.

⬤ Descubra cómo trazar histogramas, gráficos de frecuencia, gráficos de dispersión, gráficos de caja, y mucho más.

⬤ Conectar Optimus con bibliotecas populares de visualización de Python como Plotly y Altair.

⬤ Aplicar técnicas de agrupamiento de cadenas para normalizar cadenas.

⬤ Descubrir funciones para explorar, corregir y eliminar datos de baja calidad.

⬤ Utilizar técnicas avanzadas para eliminar los valores atípicos de sus datos.

⬤ Añadir motores y funciones personalizadas para limpiar, procesar y fusionar datos.

A quién va dirigido este libro:

Este libro está dirigido a desarrolladores de Python que deseen explorar, transformar y preparar big data para aprendizaje automático, análisis e informes utilizando Optimus, una API unificada para trabajar con Pandas, Dask, cuDF, Dask-cuDF, Vaex y Spark. Aunque no es necesario, se valorarán conocimientos básicos de Python. Se requieren conocimientos básicos de la CLI para instalar Optimus y sus requisitos. Para utilizar tecnologías GPU, necesitarás una tarjeta gráfica NVIDIA compatible con la librería RAPIDS de NVIDIA, compatible con Windows 10 y Linux.

Otros datos del libro:

ISBN:9781801079563
Autor:
Editorial:
Idioma:inglés
Encuadernación:Tapa blanda

Compra:

Actualmente disponible, en stock.

¡Lo compro!

Otros libros del autor:

Procesamiento de datos con Optimus: Potencie las tareas de preparación de big data para análisis y...
Redactada por el equipo central de Optimus, esta...
Procesamiento de datos con Optimus: Potencie las tareas de preparación de big data para análisis y aprendizaje automático con Optimus utilizando Dask y PySpark - Data Processing with Optimus: Supercharge big data preparation tasks for analytics and machine learning with Optimus using Dask and PySpark

Las obras del autor han sido publicadas por las siguientes editoriales:

© Book1 Group - todos los derechos reservados.
El contenido de este sitio no se puede copiar o usar, ni en parte ni en su totalidad, sin el permiso escrito del propietario.
Última modificación: 2024.11.14 07:32 (GMT)