Puntuación:
El libro 'Querying Databricks with Spark SQL' ofrece una cobertura completa de los conceptos básicos y avanzados de Spark SQL. Está bien estructurado con escenarios de negocio para introducir las consultas SQL y proporciona explicaciones claras. Sin embargo, algunos lectores encontraron problemas con las instrucciones y la organización.
Ventajas:⬤ Cobertura completa de Spark SQL, adecuada tanto para principiantes como para usuarios avanzados
⬤ estructura y explicaciones claras
⬤ base de datos de ejemplo bien diseñada
⬤ valiosa sección 'Trucos y trampas'
⬤ lectura satisfactoria para profesionales de SQL que buscan temas avanzados.
⬤ Las instrucciones para la configuración del conjunto de datos no estaban claras
⬤ los recursos de GitHub estaban mal organizados
⬤ la calidad de la encuadernación del libro podría mejorarse
⬤ se echan de menos temas como las sentencias SQL MERGE, UPDATE, DELETE
⬤ contratiempo inicial con las instrucciones de importación de archivos de datos.
(basado en 2 opiniones de lectores)
Querying Databricks with Spark SQL
Una guía práctica sobre el uso de Spark SQL para realizar consultas complejas en sus datos de Databricks
Características principales.
● Aprende SQL desde cero, sin necesidad de conocimientos previos de programación o SQL.
● Construye progresivamente tus conocimientos y habilidades, desde consultas básicas de datos hasta análisis complejos.
● Obtenga experiencia práctica con SQL, cubriendo todos los niveles de conocimiento, desde principiante hasta experto.
Descripción
Databricks destaca por ser una plataforma ampliamente adoptada y dedicada a la creación de lagos de datos. Dentro de su framework, extiende el soporte a una versión especializada de Structured Query Language (SQL) conocida como Spark SQL. Si está interesado en aprender más sobre cómo utilizar Spark SQL para analizar datos en un lago de datos, este libro es para usted.
El libro abarca desde consultas básicas hasta tareas complejas de procesamiento de datos. Comienza con una introducción a SQL y Spark. A continuación, cubre los conceptos básicos de SQL, incluidos los tipos de datos, operadores y cláusulas. Los siguientes capítulos se centran en el filtrado, la agregación y el cálculo. Además, cubre fechas y horas, formateo de resultados y uso de la lógica en las consultas. También trata la unión de tablas, las subconsultas, las tablas derivadas y las expresiones comunes de tablas. Además, trata las subconsultas correlacionadas, la unión y el filtrado de conjuntos de datos, el uso de SQL en cálculos, la segmentación y clasificación de datos, el análisis continuado y el análisis de datos a lo largo del tiempo. El libro concluye con un capítulo sobre presentación avanzada de datos.
Al final del libro, podrá utilizar Spark SQL para realizar tareas complejas de análisis de datos en lagos de datos.
Lo que aprenderá
● Utilizar Spark SQL para leer datos de un lago de datos.
● Aprender a filtrar, agregar y calcular datos mediante Spark SQL.
● Aprender a unir tablas, usar subconsultas y crear tablas derivadas en Spark SQL.
● Analizar datos a lo largo del tiempo utilizando Spark SQL para rastrear tendencias e identificar patrones en los datos.
● Presentar datos de forma visualmente atractiva utilizando Spark SQL.
A quién va dirigido este libro
Este libro es para cualquiera que quiera aprender a utilizar SQL para analizar big data. Si usted es un analista de datos, estudiante, desarrollador de base de datos, contador, analista de negocios, científico de datos, o cualquier otra persona que necesita para extraer información de grandes conjuntos de datos, este libro le enseñará las habilidades que necesita para hacer el trabajo.
Contenido
1. Escritura de consultas SQL básicas
2. 2. Filtrado de datos
3. Aplicación de Filtros Complejos a las Consultas
4. Cálculos sencillos
5. Agregación de resultados
6. Trabajar con fechas en Databricks
7. 7. Formateo de Texto en las Consultas
8. Formateo de números y fechas
9. 9. Uso de la lógica básica para mejorar el análisis
10. 10. Uso de Tablas Múltiples en la Consulta de Datos
11. 11. Uso de uniones de tablas avanzadas
12. Subconsultas
13. Tablas derivadas
14. Expresiones comunes de tabla
15. Subconsultas correlacionadas
16. Manipulación de conjuntos de datos
17. Uso de SQL para Cálculos Más Avanzados
18. Segmentación y Clasificación de Datos
19. 19. Análisis continuado
20. 20. Análisis de datos a lo largo del tiempo
21. 21. Salida de datos complejos
© Book1 Group - todos los derechos reservados.
El contenido de este sitio no se puede copiar o usar, ni en parte ni en su totalidad, sin el permiso escrito del propietario.
Última modificación: 2024.11.14 07:32 (GMT)