Análisis multivariante de datos
aplicaciones con R
- ISBN: 9788419034410
- Editorial: Garceta, Grupo Editorial
- Fecha de la edición: 2024
- Lugar de la edición: Madrid. España
- Encuadernación: Rústica
- Medidas: 24 cm
- Nº Pág.: 472
- Idiomas: Español
Este libro tiene como finalidad el tratamiento de las técnicas de análisis multivariante de datos, es decir, del con- junto de métodos estadísticos cuya finalidad es analizar simultáneamente conjuntos de datos con varias varia- bles medidas para cada individuo u objeto estudiado
La disponibilidad de grandes volúmenes de información y el uso generalizado de las herramientas informáticas ha transformado el análisis de datos estableciendo un orden en las técnicas especializadas que se aplican y englobándolas en el proceso de extracción del conocimiento. Estas técnicas persiguen el descubrimiento automático de la información contenida en los datos utilizando metodologías avanzadas de análisis estadístico multivariante.
El libro comienza tratando las técnicas de reducción de la dimensión, que permiten simplificar ordenadamente el excesivo número de variables a tratar con la mínima pérdida de información. Si se trata de variables cuantitativas, las técnicas que permiten este tratamiento son el Análisis de Componentes Principales y el Análisis Factorial, y si se trabaja con variables cualitativas, se acudirá a las Tablas de Contingencia y al Análisis de Correspondencias Simples y Múltiples.
Por otra parte, el Escalamiento Multidimensional se puede utilizar tanto para variable cuantitativas como cualitativas. Todas estas técnicas se denominan descriptivas o de aprendizaje no supervisado porque no conllevan un modelo en el que se distinga entre variables independientes y dependientes.
A continuación, se tratan las técnicas de clasificación y segmentación, que tienen como finalidad clasificar los individuos en grupos más o menos homogéneos en relación al perfil que presentan en sus variables. Entre estas técnicas destacan el Escalamiento Multidimensional y el Análisis Clúster como técnicas descriptivas y el Análisis Discriminante, los Modelos Lineales Generalizados, los modelos Logit y Probit y los Árboles de Decisión como técnicas predictivas o de aprendizaje supervisado (conllevan un modelo).
Finalmente se tratan las Redes Neuronales, que mejoran las técnicas anteriores mediante algoritmos avanzados que optimizan las predicciones y la segmentación.
Todas estas técnicas se ilustran con ejercicios prácticos representativos totalmente resueltos con el software R.