Puntuación:
Actualmente no hay opiniones de lectores. La calificación se basa en 8 votos.
Learning Apache Drill: Query and Analyze Distributed Data Sources with SQL
Ponte al día con Apache Drill, un motor de consulta SQL distribuido extensible que lee conjuntos de datos masivos en muchos formatos de archivo populares como Parquet, JSON y CSV. Drill lee datos en HDFS o en almacenamiento nativo en la nube como S3 y funciona con metastores Hive junto con bases de datos distribuidas como HBase, MongoDB y bases de datos relacionales. Drill funciona en todas partes: en su portátil o en su clúster más grande.
En este libro práctico, los autores de Drill, Charles Givre y Paul Rogers, muestran a los analistas y científicos de datos cómo consultar y analizar datos sin procesar utilizando esta potente herramienta. Hoy en día, los científicos de datos dedican aproximadamente el 80% de su tiempo a recopilar y limpiar datos. Con este libro, aprenderá cómo Drill le ayuda a analizar los datos de forma más eficaz para reducir el tiempo de obtención de información.
⬤ Utilice Drill para limpiar, preparar y resumir datos delimitados para su posterior análisis.
⬤ Consulte tipos de archivos, incluidos archivos de registro, Parquet, JSON y otros formatos complejos.
⬤ Consultar Hadoop, bases de datos relacionales, MongoDB y Kafka con SQL estándar.
⬤ Conéctese a Drill programáticamente usando una variedad de lenguajes.
⬤ Utilizar Drill incluso con formatos de archivo difíciles o ambiguos.
⬤ Realizar análisis sofisticados ampliando la funcionalidad de Drill con funciones definidas por el usuario.
⬤ Facilite el análisis de datos para la seguridad de la red, los metadatos de imágenes y el aprendizaje automático.
© Book1 Group - todos los derechos reservados.
El contenido de este sitio no se puede copiar o usar, ni en parte ni en su totalidad, sin el permiso escrito del propietario.
Última modificación: 2024.11.14 07:32 (GMT)