Apache Spark en 24 Horas, Sams Teach Yourself

Puntuación:   (4,4 de 5)

Apache Spark en 24 Horas, Sams Teach Yourself (Jeffrey Aven)

Opiniones de los lectores

Resumen:

El libro proporciona una sólida introducción a Apache Spark, especialmente para aquellos que ya están familiarizados con el desarrollo de software. Está bien estructurado, cubre temas básicos y avanzados, principalmente en Python y aborda características relevantes de Spark. Sin embargo, algunos usuarios notaron información desactualizada, particularmente relacionada con instalaciones, y una falta de casos de uso avanzados o de cobertura en profundidad en ciertas áreas.

Ventajas:

Proporciona un enfoque bien estructurado y metódico para un aprendizaje rápido.
Bueno para principiantes y entusiastas de Python.
Cubre una amplia variedad de características de Spark, incluyendo Spark-SQL y MLlib.
Accesible y fácil de digerir, por lo que es adecuado para un rápido arranque en Spark.
Incluye referencias a artículos de investigación para una comprensión más profunda.

Desventajas:

Parte de la información no está actualizada, especialmente en lo que respecta a las instalaciones y los binarios de Hadoop.
Carece de casos de uso avanzados y consejos para ajustar el rendimiento.
Se centra principalmente en Python, con menos énfasis en Scala o temas avanzados.
Se observan varios errores ortográficos, lo que indica la necesidad de una mejor corrección.
Algunos capítulos, como Spark Streaming, carecen de profundidad.

(basado en 23 opiniones de lectores)

Título original:

Apache Spark in 24 Hours, Sams Teach Yourself

Contenido del libro:

Apache Spark es un motor de procesamiento distribuido de código abierto rápido, escalable y flexible para sistemas de big data y es uno de los proyectos de big data de código abierto más activos hasta la fecha. En sólo 24 lecciones de una hora o menos, Sams Teach Yourself Apache Spark in 24 Hours le ayuda a construir soluciones prácticas de Big Data que aprovechan la increíble velocidad, escalabilidad, simplicidad y versatilidad de Spark.

El enfoque directo y paso a paso de este libro le muestra cómo implementar, programar, optimizar, gestionar, integrar y ampliar Spark, ahora y en los años venideros. Descubrirá cómo crear potentes soluciones que abarcan la computación en nube, el procesamiento de flujos en tiempo real, el aprendizaje automático y mucho más. Cada lección se basa en lo que ya ha aprendido, dándole una base sólida para el éxito en el mundo real.

Si usted es un analista de datos, ingeniero de datos, científico de datos, o administrador de datos, el aprendizaje de Spark le ayudará a avanzar en su carrera o embarcarse en una nueva carrera en el área en auge de Big Data.

Aprenda a.

- Descubrir qué hace Apache Spark y cómo encaja en el panorama de Big Data.

- Implementar y ejecutar Spark localmente o en la nube.

- Interactuar con Spark desde el shell.

- Aprovechar al máximo la arquitectura de clúster de Spark.

- Desarrollar aplicaciones Spark con Scala y Python funcional.

- Programar con la API de Spark, incluyendo transformaciones y acciones.

- Aplicar enfoques prácticos de ingeniería/análisis de datos diseñados para Spark.

- Utilizar conjuntos de datos distribuidos resistentes (RDD) para el almacenamiento en caché, la persistencia y la salida.

- Optimizar el rendimiento de la solución Spark.

- Utilizar Spark con SQL (a través de Spark SQL) y con NoSQL (a través de Cassandra).

- Aprovechar las últimas técnicas de programación funcional.

- Ampliar Spark con streaming, R y Sparkling Water.

- Empezar a crear aplicaciones de aprendizaje automático y procesamiento de gráficos basadas en Spark.

- Explorar tecnologías avanzadas de mensajería, incluyendo Kafka.

- Previsualice y prepárese para la próxima generación de innovaciones de Spark.

Las instrucciones le guiarán a través de preguntas, problemas y tareas comunes.

Las preguntas y respuestas, los cuestionarios y los ejercicios amplían y ponen a prueba sus conocimientos.

Los consejos "¿Sabía que...?" le ofrecen información privilegiada y atajos.

Y las alertas "Cuidado" le ayudarán a evitar escollos. Cuando termine, se sentirá cómodo utilizando Apache Spark para resolver un amplio espectro de problemas de Big Data.

Otros datos del libro:

ISBN:9780672338519
Autor:
Editorial:
Encuadernación:Tapa blanda
Año de publicación:2016
Número de páginas:592

Compra:

Actualmente disponible, en stock.

¡Lo compro!

Otros libros del autor:

Apache Spark en 24 Horas, Sams Teach Yourself - Apache Spark in 24 Hours, Sams Teach...
Apache Spark es un motor de procesamiento distribuido de código abierto...
Apache Spark en 24 Horas, Sams Teach Yourself - Apache Spark in 24 Hours, Sams Teach Yourself

Las obras del autor han sido publicadas por las siguientes editoriales:

© Book1 Group - todos los derechos reservados.
El contenido de este sitio no se puede copiar o usar, ni en parte ni en su totalidad, sin el permiso escrito del propietario.
Última modificación: 2024.11.14 07:32 (GMT)