Aprendiendo Apache Drill: Domine las Consultas SQL de Fuentes de Datos Distribuidas

Aprendizaje de Apache Drill: Consulta y Análisis de Fuentes de Datos Distribuidas con SQL (Charles Givre)

Opiniones de los lectores

Actualmente no hay opiniones de lectores. La calificación se basa en 8 votos.

Título original:

Learning Apache Drill: Query and Analyze Distributed Data Sources with SQL

Contenido del libro:

Ponte al día con Apache Drill, un motor de consulta SQL distribuido extensible que lee conjuntos de datos masivos en muchos formatos de archivo populares como Parquet, JSON y CSV. Drill lee datos en HDFS o en almacenamiento nativo en la nube como S3 y funciona con metastores Hive junto con bases de datos distribuidas como HBase, MongoDB y bases de datos relacionales. Drill funciona en todas partes: en su portátil o en su clúster más grande.

En este libro práctico, los autores de Drill, Charles Givre y Paul Rogers, muestran a los analistas y científicos de datos cómo consultar y analizar datos sin procesar utilizando esta potente herramienta. Hoy en día, los científicos de datos dedican aproximadamente el 80% de su tiempo a recopilar y limpiar datos. Con este libro, aprenderá cómo Drill le ayuda a analizar los datos de forma más eficaz para reducir el tiempo de obtención de información.

⬤ Utilice Drill para limpiar, preparar y resumir datos delimitados para su posterior análisis.

⬤ Consulte tipos de archivos, incluidos archivos de registro, Parquet, JSON y otros formatos complejos.

⬤ Consultar Hadoop, bases de datos relacionales, MongoDB y Kafka con SQL estándar.

⬤ Conéctese a Drill programáticamente usando una variedad de lenguajes.

⬤ Utilizar Drill incluso con formatos de archivo difíciles o ambiguos.

⬤ Realizar análisis sofisticados ampliando la funcionalidad de Drill con funciones definidas por el usuario.

⬤ Facilite el análisis de datos para la seguridad de la red, los metadatos de imágenes y el aprendizaje automático.

Otros datos del libro:

ISBN:	9781492032793
Autor:	Charles Givre
Editorial:	Oreilly Media
Encuadernación:	Tapa blanda
Año de publicación:	2018
Número de páginas:	334

Compra:

Actualmente disponible, en stock.

Aprendizaje de Apache Drill: Consulta y Análisis de Fuentes de Datos Distribuidas con SQL

Opiniones de los lectores

Título original:

Contenido del libro:

Otros datos del libro:

Compra:

Otros libros del autor:

Las obras del autor han sido publicadas por las siguientes editoriales: