Puntuación:
Este libro es una guía completa y sencilla para principiantes centrada en la limpieza y preparación de datos para el aprendizaje automático. Ofrece ejercicios prácticos, ideas valiosas y técnicas prácticas que a menudo faltan en otros recursos. Aunque está muy bien valorado por sus explicaciones claras y ejemplos útiles, hay indicios de que puede carecer de profundidad en algunos temas avanzados.
Ventajas:⬤ Explicaciones completas y claras de las técnicas de limpieza y preparación de datos.
⬤ Ejercicios prácticos y ejemplos de código disponibles en GitHub.
⬤ Excelente para principiantes y sirve de referencia sólida para usuarios experimentados.
⬤ Estilo de escritura atractivo y accesible; se siente conversacional.
⬤ Se centra en las técnicas más valiosas que impulsan los resultados en el aprendizaje automático.
⬤ Carece de profundidad en temas avanzados como el aprendizaje profundo y el análisis de errores.
⬤ Algunos lectores desean un conjunto de herramientas más amplio para aplicaciones de modelado complejas.
⬤ Se centra más en el contenido para principiantes, lo que puede no satisfacer a los científicos de datos más experimentados que buscan conocimientos avanzados.
(basado en 7 opiniones de lectores)
Data Cleaning and Exploration with Machine Learning: Get to grips with machine learning techniques to achieve sparkling-clean data quickly
Explore técnicas de aprendizaje automático sobrealimentadas para ocuparse de sus cargas de lavandería de datos.
Características principales:
⬤ Aprenda a preparar los datos para los procesos de aprendizaje automático.
⬤ Entender qué algoritmos se basan en los objetivos de predicción y las propiedades de los datos.
⬤ Explore cómo interpretar y evaluar los resultados del aprendizaje automático.
Descripción del libro:
Muchas personas que saben cómo ejecutar algoritmos de aprendizaje automático no tienen un buen sentido de los supuestos estadísticos que hacen y cómo hacer coincidir las propiedades de los datos con el algoritmo para obtener los mejores resultados.
Al empezar con este libro, los modelos se eligen cuidadosamente para ayudarle a comprender los datos subyacentes, incluida la importancia y correlación de las características, y la distribución de características y objetivos. Las dos primeras partes del libro le presentan las técnicas para preparar los datos para los algoritmos de ML, sin tener reparos en utilizar algunas técnicas de ML para la limpieza de datos, incluida la detección de anomalías y la selección de características. A continuación, el libro le ayuda a aplicar esos conocimientos a una amplia variedad de tareas de ML. Comprenderá los algoritmos supervisados y no supervisados más populares, cómo preparar los datos para ellos y cómo evaluarlos. A continuación, construirá modelos y comprenderá las relaciones en sus datos, además de realizar tareas de limpieza y exploración con esos datos. Progresará rápidamente en el estudio de la distribución de las variables, la identificación de anomalías y el examen de las relaciones bivariantes, ya que en este libro se centra más en la precisión de las predicciones.
Al final de este libro, usted será capaz de hacer frente a problemas de datos complejos utilizando algoritmos de ML no supervisados como el análisis de componentes principales y k-means clustering.
Lo que aprenderá:
⬤ Explore las técnicas esenciales de limpieza y exploración de datos que deben utilizarse antes de ejecutar los algoritmos de aprendizaje automático más populares.
⬤ Comprender cómo realizar el preprocesamiento y la selección de características, y cómo configurar los datos para las pruebas y la validación.
⬤ Modelar objetivos continuos con algoritmos de aprendizaje supervisado.
⬤ Modelar objetivos binarios y multiclase con algoritmos de aprendizaje supervisado.
⬤ Ejecutar clustering y reducción de dimensiones con algoritmos de aprendizaje no supervisado.
⬤ Entender cómo utilizar árboles de regresión para modelar un objetivo continuo.
A quién va dirigido:
Este libro está dirigido a científicos de datos profesionales, particularmente aquellos en los primeros años de su carrera, o analistas más experimentados que son relativamente nuevos en el aprendizaje automático. Los lectores deben tener conocimientos previos de los conceptos de estadística que se suelen enseñar en un curso introductorio de licenciatura, así como experiencia de nivel principiante en la manipulación de datos mediante programación.
© Book1 Group - todos los derechos reservados.
El contenido de este sitio no se puede copiar o usar, ni en parte ni en su totalidad, sin el permiso escrito del propietario.
Última modificación: 2024.11.14 07:32 (GMT)