Puntuación:
El libro proporciona una exploración profunda y profunda de las arquitecturas de datos modernas, centrándose en la arquitectura delta, la gobernanza de datos y la construcción de productos de datos dentro de un marco de malla de datos. También hace hincapié en la importancia de las visualizaciones de datos y las aplicaciones prácticas en escenarios reales utilizando Python.
Ventajas:Cobertura exhaustiva de las arquitecturas de datos modernas, ejemplos prácticos en Python, exploración perspicaz de la gobernanza y la integridad de los datos, enfoque en MLOps e integración de visualizaciones de datos, accesible para ingenieros, analistas y directivos.
Desventajas:Puede resultar demasiado técnico para principiantes sin conocimientos previos de arquitecturas de datos, algunos lectores pueden encontrar abrumadora la profundidad, y puede que no cubra todos los temas en detalle.
(basado en 5 opiniones de lectores)
Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python
Construye ecosistemas de datos escalables y fiables utilizando Data Mesh, Databricks Spark y Kafka.
Características principales:
⬤ Desarrolle habilidades modernas de datos utilizadas en tecnologías emergentes.
⬤ Aprenda metodologías de diseño pragmáticas como Data Mesh y data lakehouses.
⬤ Obtenga una comprensión más profunda de la gobernanza de datos.
⬤ La compra del libro impreso o Kindle incluye un eBook PDF gratuito.
Descripción del libro
Modern Data Architectures with Python le enseñará cómo incorporar sin problemas sus flujos de trabajo de aprendizaje automático y ciencia de datos en sus plataformas de datos abiertos. Aprenderá a tomar sus datos y crear lagos abiertos que funcionen con cualquier tecnología utilizando técnicas probadas, incluyendo la arquitectura medallón y Delta Lake.
Empezando por los fundamentos, este libro te ayudará a construir pipelines en Databricks, una plataforma de datos abierta, usando SQL y Python. Conocerás los cuadernos y las aplicaciones escritas en Python utilizando herramientas estándar de ingeniería de software como git, pre-commit, Jenkins y Github. A continuación, profundizarás en el procesamiento de datos en streaming y por lotes utilizando Apache Spark y Confluent Kafka. A medida que avance, aprenderá a desplegar sus recursos utilizando la infraestructura como código y a automatizar sus flujos de trabajo y el desarrollo de código. Dado que la capacidad de cualquier plataforma de datos para manejar y trabajar con IA y ML es un componente vital, también explorará los conceptos básicos de ML y cómo trabajar con herramientas modernas de MLOps. Por último, obtendrá experiencia práctica con Apache Spark, una de las tecnologías de datos clave en el mercado actual.
Al final de este libro, habrá acumulado una gran cantidad de conocimientos prácticos y teóricos para construir, gestionar, orquestar y arquitecturar sus ecosistemas de datos.
Lo que aprenderá:
⬤ Comprender los patrones de datos, incluida la arquitectura delta.
⬤ Descubrir cómo aumentar el rendimiento con Spark internals.
⬤ Averiguar cómo diseñar diagramas de datos críticos.
⬤ Explorar MLOps con herramientas como AutoML y MLflow.
⬤ Familiarícese con la creación de productos de datos en una malla de datos.
⬤ Descubra la gobernanza de datos y genere confianza en sus datos.
⬤ Introducir visualizaciones de datos y cuadros de mando en su práctica de datos.
A quién va dirigido este libro:
Este libro es para desarrolladores, ingenieros de análisis y gerentes que buscan desarrollar aún más un ecosistema de datos dentro de su organización. Aunque no son requisitos previos, un conocimiento básico de Python y experiencia previa con datos le ayudarán a leer y seguir los ejemplos.
© Book1 Group - todos los derechos reservados.
El contenido de este sitio no se puede copiar o usar, ni en parte ni en su totalidad, sin el permiso escrito del propietario.
Última modificación: 2024.11.14 07:32 (GMT)