Puntuación:
Actualmente no hay opiniones de lectores. La calificación se basa en 4 votos.
Machine Learning with PySpark: With Natural Language Processing and Recommender Systems
Domine las nuevas características de PySpark 3. 1 para desarrollar aplicaciones inteligentes basadas en datos. Esta edición actualizada cubre temas que van desde la construcción de modelos de aprendizaje automático escalables, hasta el procesamiento del lenguaje natural y los sistemas de recomendación.
Machine Learning with PySpark, Second Edition comienza con los fundamentos de Apache Spark, incluyendo las últimas actualizaciones del framework. A continuación, aprenderá todo el espectro de implementaciones tradicionales de algoritmos de aprendizaje automático, junto con el procesamiento del lenguaje natural y los sistemas de recomendación. Se familiarizará con el proceso crítico de selección de algoritmos de aprendizaje automático, ingestión de datos y procesamiento de datos para resolver problemas empresariales. Verá una demostración de cómo construir modelos supervisados de aprendizaje automático, como regresión lineal, regresión logística, árboles de decisión y bosques aleatorios. También aprenderá a automatizar los pasos utilizando Spark pipelines, seguido de modelos no supervisados como K-means y clustering jerárquico. Una sección sobre Procesamiento del Lenguaje Natural (PLN) cubre el procesamiento de textos, la minería de textos y las incrustaciones para la clasificación. Esta nueva edición también introduce Koalas en Spark y cómo automatizar el flujo de trabajo de datos utilizando Airflow y la última biblioteca ML de PySpark.
Después de completar este libro, comprenderá cómo utilizar la biblioteca de aprendizaje automático de PySpark para construir y entrenar varios modelos de aprendizaje automático, junto con componentes relacionados como la ingestión, el procesamiento y la visualización de datos para desarrollar aplicaciones inteligentes basadas en datos.
Lo que aprenderá:
⬤ Construir un espectro de algoritmos de aprendizaje automático supervisados y no supervisados.
⬤ Utilizar la librería de aprendizaje automático de PySpark para implementar sistemas de aprendizaje automático y de recomendación.
⬤ Aprovechar las nuevas características de la librería de aprendizaje automático de PySpark.
⬤ Comprender el procesamiento de datos utilizando Koalas en Spark.
⬤ Manejar problemas en torno a la ingeniería de características, el equilibrio de clases, el sesgo y la varianza, y la validación cruzada para construir modelos óptimamente ajustados.
A quién va dirigido este libro
Profesionales de la ciencia de datos y el aprendizaje automático.
© Book1 Group - todos los derechos reservados.
El contenido de este sitio no se puede copiar o usar, ni en parte ni en su totalidad, sin el permiso escrito del propietario.
Última modificación: 2024.11.14 07:32 (GMT)