Arquitecturas de datos modernas con Python: Construya e Implemente Pipelines de Datos

Arquitecturas de datos modernas con Python: Una guía práctica para construir y desplegar canalizaciones de datos, almacenes de datos y lagos de datos con Python. (Brian Lipp)

Opiniones de los lectores

Resumen:

El libro proporciona una exploración profunda y profunda de las arquitecturas de datos modernas, centrándose en la arquitectura delta, la gobernanza de datos y la construcción de productos de datos dentro de un marco de malla de datos. También hace hincapié en la importancia de las visualizaciones de datos y las aplicaciones prácticas en escenarios reales utilizando Python.

Ventajas:

Cobertura exhaustiva de las arquitecturas de datos modernas, ejemplos prácticos en Python, exploración perspicaz de la gobernanza y la integridad de los datos, enfoque en MLOps e integración de visualizaciones de datos, accesible para ingenieros, analistas y directivos.

Desventajas:

Puede resultar demasiado técnico para principiantes sin conocimientos previos de arquitecturas de datos, algunos lectores pueden encontrar abrumadora la profundidad, y puede que no cubra todos los temas en detalle.

(basado en 5 opiniones de lectores)

Título original:

Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python

Contenido del libro:

Construye ecosistemas de datos escalables y fiables utilizando Data Mesh, Databricks Spark y Kafka.

Características principales:

⬤ Desarrolle habilidades modernas de datos utilizadas en tecnologías emergentes.

⬤ Aprenda metodologías de diseño pragmáticas como Data Mesh y data lakehouses.

⬤ Obtenga una comprensión más profunda de la gobernanza de datos.

⬤ La compra del libro impreso o Kindle incluye un eBook PDF gratuito.

Descripción del libro

Modern Data Architectures with Python le enseñará cómo incorporar sin problemas sus flujos de trabajo de aprendizaje automático y ciencia de datos en sus plataformas de datos abiertos. Aprenderá a tomar sus datos y crear lagos abiertos que funcionen con cualquier tecnología utilizando técnicas probadas, incluyendo la arquitectura medallón y Delta Lake.

Empezando por los fundamentos, este libro te ayudará a construir pipelines en Databricks, una plataforma de datos abierta, usando SQL y Python. Conocerás los cuadernos y las aplicaciones escritas en Python utilizando herramientas estándar de ingeniería de software como git, pre-commit, Jenkins y Github. A continuación, profundizarás en el procesamiento de datos en streaming y por lotes utilizando Apache Spark y Confluent Kafka. A medida que avance, aprenderá a desplegar sus recursos utilizando la infraestructura como código y a automatizar sus flujos de trabajo y el desarrollo de código. Dado que la capacidad de cualquier plataforma de datos para manejar y trabajar con IA y ML es un componente vital, también explorará los conceptos básicos de ML y cómo trabajar con herramientas modernas de MLOps. Por último, obtendrá experiencia práctica con Apache Spark, una de las tecnologías de datos clave en el mercado actual.

Al final de este libro, habrá acumulado una gran cantidad de conocimientos prácticos y teóricos para construir, gestionar, orquestar y arquitecturar sus ecosistemas de datos.

Lo que aprenderá:

⬤ Comprender los patrones de datos, incluida la arquitectura delta.

⬤ Descubrir cómo aumentar el rendimiento con Spark internals.

⬤ Averiguar cómo diseñar diagramas de datos críticos.

⬤ Explorar MLOps con herramientas como AutoML y MLflow.

⬤ Familiarícese con la creación de productos de datos en una malla de datos.

⬤ Descubra la gobernanza de datos y genere confianza en sus datos.

⬤ Introducir visualizaciones de datos y cuadros de mando en su práctica de datos.

A quién va dirigido este libro:

Este libro es para desarrolladores, ingenieros de análisis y gerentes que buscan desarrollar aún más un ecosistema de datos dentro de su organización. Aunque no son requisitos previos, un conocimiento básico de Python y experiencia previa con datos le ayudarán a leer y seguir los ejemplos.

Otros datos del libro:

ISBN:	9781801070492
Autor:	Brian Lipp
Editorial:	Packt Pub
Idioma:	inglés
Encuadernación:	Tapa blanda

Compra:

Actualmente disponible, en stock.

Arquitecturas de datos modernas con Python: Una guía práctica para construir y desplegar canalizaciones de datos, almacenes de datos y lagos de datos con Python.

Opiniones de los lectores

Título original:

Contenido del libro:

Otros datos del libro:

Compra:

Otros libros del autor:

Las obras del autor han sido publicadas por las siguientes editoriales: