Puntuación:
El libro ha recibido críticas dispares: algunos lectores lo consideran muy valioso para comprender y aplicar el análisis de texto en el almacenamiento de datos, mientras que otros lo critican por anticuado y carente de profundidad.
Ventajas:⬤ Proporciona explicaciones claras de los conceptos de análisis de texto, lo que facilita la comunicación con la dirección.
⬤ Ofrece nuevas perspectivas sobre estrategias de almacenamiento e indexación, beneficiosas para los equipos de data warehouse.
⬤ Contiene ideas valiosas que pueden mejorar las prácticas de manejo y gestión de datos.
⬤ Algunos lectores lo consideraron excesivamente caro y carente de suficiente información útil.
⬤ Críticas al contenido repetitivo y a la dependencia de conceptos anticuados del data warehousing tradicional.
⬤ Otros señalaron la incapacidad del autor para abordar eficazmente los datos no estructurados, tachando el libro de estar lleno de jerga y palabrería.
(basado en 6 opiniones de lectores)
Building the Unstructured Data Warehouse: Architecture, Analysis, and Design
Aprenda técnicas esenciales de la leyenda de los almacenes de datos Bill Inmon sobre cómo crear el entorno de generación de informes que su empresa necesita ahora.
En el texto se esconden las respuestas a muchas preguntas empresariales valiosas. ¿Hasta qué punto puede su actual entorno de generación de informes extraer el texto necesario del correo electrónico, las hojas de cálculo y los documentos, y ponerlo en un formato útil para el análisis y la generación de informes? Transformar el almacén de datos tradicional en un almacén de datos no estructurados eficiente requiere habilidades adicionales por parte del analista, el arquitecto, el diseñador y el desarrollador. Este libro le preparará para implementar con éxito un almacén de datos no estructurados y, a través de explicaciones claras, ejemplos y casos prácticos, aprenderá nuevas técnicas y consejos para obtener y analizar texto con éxito.
Domine estos diez objetivos:
⬤ Construir un almacén de datos no estructurados utilizando el enfoque de 11 pasos.
⬤ Integrar texto y describirlo en términos de homogeneidad, relevancia, medio, volumen y estructura.
⬤ Superar los retos, como la palabrería, la Torre de Babel y la falta de relaciones naturales.
⬤ Evitar la chatarrería de datos y combatir la "tela de araña".
⬤ Reutilizar las técnicas perfeccionadas en el almacén de datos tradicional y en el almacén de datos 2.0, incluido el desarrollo iterativo. 0, incluido el desarrollo iterativo.
⬤ Aplicar técnicas esenciales de extracción, transformación y carga de texto (ETL), como el reconocimiento de frases, el filtrado de palabras vacías y la sustitución de sinónimos.
⬤ Diseñar el sistema de Inventario de Documentos y vincular texto no estructurado a datos estructurados.
⬤ Utilizar índices para un análisis de texto eficiente y taxonomías para una categorización externa útil.
⬤ Gestionar grandes volúmenes de datos utilizando técnicas avanzadas como los punteros hacia atrás.
⬤ Evaluar las opciones tecnológicas adecuadas para el procesamiento de datos no estructurados, como los dispositivos de almacén de datos.
© Book1 Group - todos los derechos reservados.
El contenido de este sitio no se puede copiar o usar, ni en parte ni en su totalidad, sin el permiso escrito del propietario.
Última modificación: 2024.11.14 07:32 (GMT)